BRPI0611702B1 - Captura e caracterização de cromatina co-localizada (4c) - Google Patents

Captura e caracterização de cromatina co-localizada (4c) Download PDF

Info

Publication number
BRPI0611702B1
BRPI0611702B1 BRPI0611702-3A BRPI0611702A BRPI0611702B1 BR PI0611702 B1 BRPI0611702 B1 BR PI0611702B1 BR PI0611702 A BRPI0611702 A BR PI0611702A BR PI0611702 B1 BRPI0611702 B1 BR PI0611702B1
Authority
BR
Brazil
Prior art keywords
dna
interaction
sequences
restriction enzyme
nucleotide sequence
Prior art date
Application number
BRPI0611702-3A
Other languages
English (en)
Inventor
Laat Wouter De
Frank Grosveld
Original Assignee
Univ Erasmus Medical Ct
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB0513676.7A external-priority patent/GB0513676D0/en
Priority claimed from GBGB0605449.8A external-priority patent/GB0605449D0/en
Application filed by Univ Erasmus Medical Ct filed Critical Univ Erasmus Medical Ct
Publication of BRPI0611702A2 publication Critical patent/BRPI0611702A2/pt
Publication of BRPI0611702B1 publication Critical patent/BRPI0611702B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/101Crosslinking agents, e.g. psoralen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/501Detection characterised by immobilisation to a surface being an array of oligonucleotides

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

"CAPTURA Ξ CARACT E P. IZ .AÇÃO DE cPCMnrr™Q rr— Campe da invenção Δ presente invenção diz respeite à ar.álise da fre- qfíên^: a ei*3 interação ri<=> duas ou mais seqüências de r.ucleoti- .Antecedentes da inver.ção Estudos na arquitetura nuclear de mamífero visam entender como 2 metros de DNA são dobrados em um núcleo de 10 μη, permitindo ao mesmo tempo expressão precisa dos genes que especificam o tipo de célula, e como isto é confiavel- mente propagado durante cada cicio da célula. Progresso nes- te campo vem amplamente dos estudos da microscopia, que re- velaram que genomas não são arranjados randomicamente no es- paço nuclear. Por exemplo, heterocromatina densamente empa- cotada é separada de eucromatina mais aberta, e os cromosso- mos ocupam territórios distintos no espaço nuclear. Existe um relacionamento confuso entre posição nuclear e atividade transcricional. Embora a transcrição ocorra por todo o inte- rior nuclear, genes ativos que agrupam em cromossomos prefe- rencialmente localizam-se na borda ou fora de seu território de cromossomo. Genes individuais podem migrar mediante mu- danças em seu estado de transcrição, medida centra marcos nucleares relativamente maiores, tais como territórios de cromossomo, centrômeros ou a periferia nuclear. Além do mais, dezenas de genes transcritos ativamente de separados dezenas de megabases no cromossomo podem se agrupar no nú- cleo, demonstrado recentemente por híbridização in situ de I— uül 'T.io r. y k ·*α 1' a ^ ^ C C 5 3 Ç * C t CP. C C C 1 O U C C C U Z V 0 Ξ genes selecionados. Com base na transcrição, organização ge- r.ôiráca e associada com a coordenação de replicação, recombi- nação e a probabilidade de ioci translocar (que pede levar a culignidades; e o ajuste e reajcsze de programas eoi cienét 1- ■ J O S . CITi O 3. ó tí Γι^οΙα5 ^JJdci .ayCcd, ά ·„ i. t; J. _ 1 α - 5 6 J _ óc 5. w Γ J ^ Γ."’ zaçào arquitetônica de DNA no núcleo da célula seja um con- tribuinte chave para a função genômica.
Diferentes ensaios foram desenvolvidos para permi- tir uma percepção na organização espacial de loci in vivo genômico. Um ensaio, denominado RNA-TRAP, foi desenvolvido (Carter et al. (2002) Na t. Genet. 32, 623) que envolve alve- jar peroxidase do rábano silvestre (HRP) transcritos de RNA embrionários, seguido por quantificação de deposição de bio- tina catalisada por HRP na cromatina por perto.
Um outro ensaio que foi desenvolvido é denominado tecnologia de captura de conformação de cromossomo (3C), que fornece uma ferramenta para estudar a organização estrutural de uma região genômica. Tecnologia 3C envolve análise PCR quantitativa de freqüências reticuladas entre dois fragmen- tos de restrição de DNA determinados, que dão uma medida de sua proximidade no espaço nuclear (ver Figura 1). Original- mente desenvolvidos para analisar a conformação de cromosso- mos em levedura (Dekker et al., 2002), esta tecnologia foi adaptada para investigar o relacionamento entre expressão do gene e dobra da cromatina em agrupamentos confusos de genes de mamífero (ver, por exemplo, Tclhuis et al., 2002; Palstra et al.r 2003; e Drissen et al., 2004). Resumidamente, tecno- íogia <r “ηνΛ ! v® rer. : cu \ açao ir, vivo de f^iuiiaiJclàc, dc céiu las e digestão nuclear de rromatina com uma enzima de res- trição, seguido por fragmentes de ligação de DNA que foram reticulados em um complexo. Os produtos de ligação são em seguida q u a i i+—Lj_-i_aaOa3 pal L ^ 3. . G Lapu d O U C. p — 1 G 1 0 3 Ç 3 C 3 C PCR requer o ccnnecimento aa micrmaçao de sequência ραία cada um dos fragmentos de DNA que devem ser amplif içados.
Assim, tecnologia 3C fornece uma medida de frequências da interação entre fragmentos de DNA selecionados.
Existe uma necessidade importante da tecnologia de alta produção que possa selecionar sistematicamente todo o genoma de uma maneira imparcial para loci de DNA que fazem contato uns com os outros no espaço nuclear. A presente invenção procura fornecer melhorias na tecnologia 3C.
Sumário da invenção Tecnologia 3C atualmente permite aplicar análise apenas a um número limitado de interações de DNA-DNA sele- cionadas devido às limitações da etapa de amplificação de PCR, que requer conhecimento de informação de seqüência es- pecifica pra cada fragmento a ser analisado. Além do mais, a seleção de fragmentos de restrição como candidatos para in- terações de DNA de longo alcance requer uma quantidade subs- tancial de conhecimento prévio ípor exemplo, a localização de sítios hipersensíveis) do locus de interesse, que não é freqüentemente disponível. Dada a relevância funcional de muitas interações de DNA-DNA de longo alcance descrito dessa maneira, a capacidade de selecionar randomicamente elementos de DNA que laçam uma seqüência de interesse, tais como um gene promotor, intensificador, isolante, silenciador, origem de replicação ou MAR/SAR - ou uma região genômica de inte- resse - tais como uma região densa em genes ou pobre em ge- nes, ou elemento repetitivo - pode facilitar enormemente o mapeamento de seqüências envolvidas em uma rede regulatória.
A presente invenção diz respeito à tecnologia 4C (isto é, captura e caracteriza cromatina co-localizada), que permite a análise de alta produção da freqüência de intera- ção de duas ou mais seqüências de nucleotideos no espaço nu- clear .
Tecnologia 4C (captura e caracteriza cromatina co- localizada) é uma versão modificada de tecnologia 3C que permite uma pesquisa ampla de genoma imparcial de fragmentos de DNA que interagem com um locus de escolha. Resumidamente, análise 3C é realizada como usual, mas omitindo a etapa PCR. 0 padrão 3C contém um bait (por exemplo, um fragmento de restrição de escolha que engloba um gene de interesse) liga- do a muitas seqüências de nucleotideos de interesse diferen- tes (representando o ambiente genômico deste gene). 0 padrão é clivado por uma outra enzima de restrição secundária, e ligado. Vantajosamente, uma ou mais seqüências de nucleoti- deos de interesse que são ligadas à seqüência de nucleoti- deos alvo são amplificadas usando pelo menos um (preferivel- mente, pelo menos dois) iniciador de oligonucleotideo, em que pelo menos um iniciador hibridiza para uma seqüência de DNA que flanqueia as seqüências de nucleotideos de interes- se. Tipicamente, isto produz um padrão de fragmentos de PCR que e a-ta^^nte pr^au1-: ve.. sru re reações de αΐΐιρ I i. I i_.ã ^ .in- dependentes e específicas para um determinado tecido. Em uma modalidade, HindIII e Dpnll são usados como enzima de res- trição primária e secundária. Depois, os fragmentos amplifi- o e aos ü o der ii i s a l i'uãi'cã aos e u p c i c n u j. r.c n t c nmridizadcs para um arranjo, tioicamente contra uma amestra de controle con- tendo DNA genômico digerido corrí a mesma combinação de enzi- mas de restrição.
Em uma modalidade preferida da presente invenção, os fragmentos ligados que são clivados por uma enzima de restrição secundária são subsequentemente religados para formar pequenos círculos de DNA. A tecnologia 3C foi portanto modificada de maneira tal que todas as seqüências de nucleotídeos de interesse que interagem com uma seqüência de nucleotídeos alvo fossem am- plificadas. Praticamente, isto significa que, em vez de de- senvolver uma reação de amplificação com iniciadores que são específicos para os fragmentos que se deseja analisar, é re- alizada uma amplificação usando oligonucleotídeo(s) inicia- dor(s) que hibridizam com uma seqüência de DNA que flanqueia as seqüências de nucleotídeos de interesse. Vantajosamente, 4C não é inclinado para o projeto de iniciadores PCR que são incluídos na etapa de amplificação do PCR e que podem por- lanto ser usados para pesquisar o genema completo para ele- mentos de DNA de interação.
Aspectos do sumário da presente invenção Aspectos da presente invenção são apresentados nas reivindicações anexas. -τη un pr'":e' aspecio, e ii.éuodw pàLa analisar a frequência de interação de uma seqüência de nu- ciectídeos alvo com. uma ou mais sequências de nucleotideos de interesse (por exemplo, um cu mais loci genômicos) que aS iõàpâS 3, ^ I d ,· l C 77 Γ7 3 C C 77 dlT-d Tu 177 C Ξ 7177 d 71Θ i? M: \ 77 3 ~ ticuiado; ib) aigerir o ÜNA reticuiaao com uma encima de restrição primária; (c) ligar as seqüências de nucleotideos reticuladas; (d) reverter a reticulação; (e) digerir as se- qüências de nucleotideos com uma enzima de restrição secun- dária; (f) ligar uma ou mais seqüências de DNA de composição de nucleotideos conhecida ao(s) sítio(s) de digestão de en- zima de restrição secundária disponíveis que flanqueiam uma ou mais seqüências de nucleotideos de interesse; (g) ampli- ficar uma ou mais seqüências de nucleotideos de interesse usando pelo menos dois oligonucleotídeos iniciadores, em que cada iniciador hibridiza para as seqüências de DNA que flan- queiam as seqüências de nucleotideos de interesse; (h) hi- bridizar as seqüência(s) amplíficada(s) em um arranjo; e (i) determinar a freqüência de interação entre as seqüências de DNA.
Em um segundo aspecto, é fornecido um método para analisar a freqüência de interação de uma seqüência de nu- cleotideos alvo com uma ou mais seqüências de nucleotideos (por exemplo, um ou mais loci genômicos} que compreende as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primá- ria; (c) ligar as seqüências de nucleotideos reticuladas; (d) reverter a reticulação; (e) digerir as seqüências de nu- c l eotiaeos com urna encima de :κ»ι.ι içàu aa^uiidái ±a , ( f} oi j:. calar:rar as .sequências de nucleotideos; (a) amplificar urr;a cu mais sequências de nucleotideos que sào ligadas à sequên- cia de nucleotideos alvo; ^h) opcionalmente hibridizar as rreqüència de .interaçao entre as sequências de DNA.
Em um terceiro aspecto é fornecida uma sequência de nucleotideos circularázada que compreende uma primeira e uma segunda seqüência de nucleotideos, em que as extremida- des da primeira e de uma segunda seqüência de nucleotideos são separadas por diferentes sítios de reconhecimento de en- zima de restrição, e em que a dita primeira seqüência de nu- cleotídeos é uma seqüência de nucleotideos alvo e a dita se- gunda seqüência de nucleotideos é obtenível por DNA genômico reticulado.
Em um quarto aspecto, é fornecido um método para preparar uma seqüência de nucleotideos circularizada que compreende as etapas de: (a) fornecer uma amostra de DNA re- ticulado, (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotideos retículadas; (d) reverter a reticulação; (e) digerir as se- qüências de nucleotideos com uma enzima de restrição secun- dária; e (f) circularizar as seqüências de nucleotideos.
Em um quinto aspecto, é fornecido um método para analisar a freqüêncía de interação de uma seqüência de nu- cleotideos alvo ccm uma ou mais seqüências de nucleotideos (por exemplo, um ou mais loci genômicos) que compreende o uso da seqüência de nucleotideos circularizada.
HjÍIl UILl io t? X L Ld t! j.OlllcM-.xUu u.íLl dllali J U U.c: sondas imobilizado em um suporte que compreende uma ou mais sondas que nibridizam ou são capazes de hibridizar para a seqüência de r.ucieotideos circularizada. sondas complementares em seqüência à sequência de ácido nu- cléico adjacente para cada um dos sitios de reconhecimento da enzima de restrição primária de uma enzima de restrição primária em DNA genômico.
Em um oitavo aspecto, é fornecido um processo para preparar um conjunto de sondas que compreende as etapas de: (a) identificar cada um dos sitios de reconhecimento da en- zima de restrição primária para uma enzima de restrição pri- mária no DNA genômico; (b) projetar sondas que são capazes de hibridizar para a seqüência adjacente a cada um dos si- tios de reconhecimento da enzima de restrição primária no DNA genômico; (c) sintetizar as sondas; e (d) combinar as sondas entre si para formar um conjunto de sondas, ou subs- tancialmente um conjunto de sondas.
Em um nono aspecto, é fornecido um conjunto de sondas, ou substancialmente um conjunto de sondas, obtido ou obtenível pelo processo aqui descrito.
Em um décimo aspecto, é fornecido um arranjo que compreende arranjo de sondas, ou substancialmente o conjunto de sondas aqui descrito Em um décimo primeiro aspecto, é fornecido um ar- ranjo que compreende o conjunto de sondas de acordo com o aqui descrito. —ι _ι ,ί .^ , --J -ν —s —ι ν~, -™1 "· <γλ f η r Γι ω ^ ί Ηη Ότη Γι — li, Η ι αΐίι U.c^-lillw jc^aiiuv ao^w-www^ — — —-■■ L- - cesso para preparar um arranjo que compreende a etapa de 1- mobilizar em um suporte sólido substancialmente o arrarijO de sondas ou substancialmente o conjunto de sondas aqui descri- Em um décimo terceiro aspecto, e fornecido um pro- cesso para preparar um arranjo que compreende a etapa de i- mobilizar em um suporte sólido o arranjo de sondas ou o con- junto de sondas aqui descrito.
Em um décimo quarto aspecto, é fornecido um arran- jo obtido ou obtenível pelo método aqui descrito.
Em um décimo quinto aspecto, é fornecido um método para identificar uma ou mais interações de DNA-DNA que são indicativas de um estado da doença particular que compreende a etapa de realizar as etapas (a)-(i) do primeiro e segundo aspectos da presente invenção, em que, na etapa (a), uma a- mostra de DNA reticulado é fornecida de uma célula doente e uma não doente, e em que uma diferença entre a freqüência de interação entre as seqüências de DNA das células doentes e não doentes indica que a interação de DNA-DNA é indicativa de um estado de doença particular.
Em um décimo sexto aspecto, é fornecido um método de diagnóstico ou prognóstico de uma doença ou sindrome cau- sada ou associada com uma mudança em uma interação de DNA- DNA que compreende a etapa de realizar as etapas (a)-(i) do primeiro e segundo aspectos da presente invenção, em que a etapa (a) compreende fornecer uma amostra de DNA reticulado de um sujeito; e em que a etapa (i) compreende comparar a - - i .- - : - — ~1 — r^· \ i λ i π +· requerí m a ae i ru eraçcio enut a» scqucm-j-a.» ~.·.ι. — w.,. ~i -·- 'j^Tin ccnt role não afetado; em aue uma di ferença er.tre o va- lor obtido do controle e o valor obtido do sujeito e indica- tiva que o sujeite sofre da doença cu síndrome ou é indica- .L -C v- -v r· -1 Ά - -1 — ^ v. ~ ’ o ’ rj γ·;->τ a ç_j_vd vj u c ώ j j ·— -- ·_ ·_■ -c- —· -a_~ —■· — — -- - Em uiTi oecixno sétimo aspecto, e fornecido um r.etcdc de diagnóstico ou prognóstico de uma doença ou síndrome cau- sada ou associada com uma mudança em uma interação de DNA- DNA que compreende a etapa de: realizar as etapas (a)-{i) do primeiro e segundo aspectos da presente invenção, em que a etapa (a) compreende fornecer uma amostra de DNA reticulado de um sujeito; e em que o dito método compreende a etapa a- dicional de: (j) identificar um ou mais loci que foi subme- tido a um ré-arranjo genômico que é associado com uma doen- ça .
Em um décimo oitavo aspecto, é fornecido um método de ensaio para identificar um ou mais agentes que modulam uma interação de DNA-DNA que compreende as etapas de: (a) colocar uma amostra em contato com um ou mais agentes; e (b) realizar as etapas (a) a (i) do primeiro e segundo aspectos da presente invenção, em que a etapa (a) compreende fornecer DNA reticulado da amestra; em que uma diferença er.tre (i) a frequência de in- teração entre as sequências de DNA na presença do agente e (ii) a frequência de interação entre as seqüèncias de DNA na ausência do agente é indicativa de um agente que modula a interação de DNA-DNA.
Em um décimo nono aspecto, é fornecido um método para aeteciai a iucd±iidi,du de uiu μυιι lu ae lupLuid equ_i_.il· brado e/ou desequilibrado ípor exemplo, uma transiccaçáo) que compreende a etapa de: (a; realizar as etapas (a; a ( i) do primeiro e segundo aspectos da presente invenção; e (b) JKA com a de um controle; em que urna Lrarisj-çao de juaixa α alta freqüência de interação de DNA-DNA na amostra comparado com o controle é indicativa da localização de um ponto de ruptura.
Em um vigésimo aspecto, é fornecido um método para detectar a localização de uma inversão equilibrada e/ou de- sequilibrada que compreende as etapas de: (a) realizar as etapas (a) a (i) do primeiro e segundo aspectos da presente invenção; e (b) comparar a freqüência de interação entre as seqüências de DNA com a de um controle; em que um padrão in- verso de frequências de interação de DNA-DNA para a amostra comparadas com o controle é indicativo de uma inversão.
Em um vigésimo primeiro aspecto, é fornecido um método para detectar a localização de uma deleção que com- preende as etapas de: (a) realizar as etapas (a) a (i) do primeiro e segundo aspectos da presente invenção; (b) compa- rar a freqüência de interação entre as seqüências de DNA com a de um controle; em que uma redução na interação de fre- qüência de DNA-DNA para a amostra comparada com o controle é indicativa de deleçâc.
Em um vigésimo segundo aspecto, é fornecido um mé- todo para detectar a localização de uma duplicação que com- preende as etapas de: (a) realizar as etapas (a) a (i) do „ -.-1,-,: _ ., ~J , 4 , ,. ,„ , = , ; Λ '£) C.T.- pr-.. ί·* ■ " 1 ---■--. τ-*-/ - ■ - parar a freqüência de interação entre as seqüências de DNA coiri a oe um comoiS; ero que um aurrientc ou um.a dim,,nu-^çâo ..a interação de frequência de DNA-DNA para a amostra do sujeite comparado com o controle é ’ndi cativo de uma nup.rcaoao ou inserção.
Em um vigésimo terceiro aspecto, é fornecido um agente obtido ou obtenível pelo método de arranjo aqui des- crito.
Em um vigésimo quarto aspecto, é possibilitado o uso da seqüência de nucleotídeos círcularizada para identi- ficar uma ou mais interações de DNA-DNA em uma amostra.
Em um vigésimo quinto aspecto, é possibilitado o uso da seqüência de nucleotídeos círcularizada para o diag- nóstico ou prognóstico de uma doença ou síndrome causada ou associada com uma mudança em uma interação de DNA-DNA.
Em um vigésimo sexto aspecto, é possibilitado o uso do arranjo de sondas ou o conjunto de sondas aqui des- crito para identificar uma ou mais interações de DNA-DNA em uma amestra.
Em um vigésimo sétimo aspecto, é possibilitado o uso do arranjo de sondas ou o conjunto de sondas aqui des- crito para o diagnóstico ou prognóstico da doença ou síndro- me causada ou associada com uma mudança em uma interação de DNA-DNA.
Em um vigésimo oitavo aspecto, é possibilitado o uso do arranjo aqui descrito para identificar uma ou mais interações de DNA-DNA em uma amostra.
Em um vigésimo nono aspecto, é possibilitado o uso do arranjo aqui descrito para o diagnóstico ou prognóstico de uma doença ou sindrome causada ou associada com uma mu- dança em uma interação de DNA-DNA.
Em um trigésimo aspecto, é fornecido um método, 5 um arranjo de sondas, um conjunto de sondas, um processo, um arranjo, um método de ensaio, um agente, ou um uso subs- tancialmente da forma aqui descrita e com referência a qualquer dos Exemplos ou Figuras.
Modalidades preferidas Preferivelmente, a reação da ligação na etapa (f) resulta na formação de círculos de DNA.
Preferivelmente, a seqüência de nucleotídeos alvo é selecionada do grupo que consiste em um ré-arranjo genômi- co, promotor, um intensificador, um silenciador, um isolan- te, uma região de anexação de matriz, uma região de controle de locus, uma unidade de transcrição, uma origem de replica- ção, um ponto de acesso de recombinação, um ponto de ruptura de translocação, um centrômero, um telômero, uma região den- sa em genes, uma região pobre em genes, um elemento repeti- tivo e um sítio de integração (viral).
Preferivelmente, a seqüência de nucleotídeos alvo é uma seqüência de nucleotídeos que é associada com uma do- ença, ou que causa a mesma, ou é localizada até 15 Mb ou mais em um padrão de DNA linear de um locus que é associado com uma doença ou que causa a mesma.
Preferivelmente, a seqüência de nucleotídeos alvos é selecionada do grupo que consiste em: AML1, MLL, MYC, BCL, f-} /-* —1 Τ.Λ-'Τ -r τ_ -r-Γ m -η 1 ττι Τ Ο Τη/Γ-^Ο .ΤΙ^Π -.. / ΣΤ ’ΤΓ' Π Ο .-. ’ΤΛν ί_) ν_-1\ { /1iD ü_í _L / J. LJii / J_/ J. / _L J_ /· _L Λ. J_j -i_Jl 'JL/Z ^ -Ll_-x\ Ç/l / L/ / 1UJ.'\|J O ou outros loci associados com doença como descrito em "Cata- logue of unbalanced Chromossome Aberrations in Man" 2nd edi- tion. Aibert Schinzei. Berlin: Waiter de Gruyter, 2001. ISBN. s-1 i-011 60*7-? .
Freieriveiíaente, a enzima ae restrição primaria e uma enzima de restrição que reconhece um sítio de reconheci- mento de 6-8 bp.
Preferivelmente, a enzima de restrição primária é selecionada do grupo que consiste em BglII, HindIII, EcoRI, BamHI, Spel, PstI e Wdel.
Preferivelmente, a enzima de restrição secundária é uma enzima de restrição que reconhece um sitio de reconhe- cimento de seqüência de nucleotídeos de 4 ou 5 bp.
Preferivelmente, o sitio de reconhecimento da en- zima de restrição secundária é localizado em mais que cerca de 350 bp do sitio de restrição primário na seqüência de nu- cleotídeos alvo.
Preferivelmente, a seqüência de nucleotídeos é marcada.
Preferivelmente, as sondas são complementares em seqüência à seqüência de ácido nucléico adjacente a cada la- do de cada um dos sítios de reconhecimento da enzima de res- trição primária de uma enzima de restrição primária no DNA genômico.
Preferivelmente, as sondas são complementares em seqüência à seqüência de ácido nucléico que está menos que 300 pares de base de cada um dos sítios de reconhecimento da enzima de restrição primária de uma enzima de restrição pri- mária no DNA genômico.
Preferivelmente, as sondas são complementares à seqüência que está menos que 3Q0 òp de cada um dos sítios de reconhecimento da enzima de restrição primária de uma enzima de restrição primária no DNA genômico.
Preferivelmente, as scr.das são complementares à seqüência que está entre 200 e 300 bp de cada um dos sítios de reconhecimento da enzima de restrição primária de uma en- zima de restrição primária no DNA genômico.
Preferivelmente, as sondas são complementares à seqüência que está entre 100 e 200 bp ou 0 a 100 bp de cada um dos sítios de reconhecimento da enzima de restrição pri- mária de uma enzima de restrição primária no DNA genômico.
Preferivelmente, duas ou mais as sondas são capa- zes de hibridizar para a seqüência adjacente a cada sítio de reconhecimento da enzima de restrição primária de uma enzima de restrição primária no DNA genômico.
Preferivelmente, as sondas sobrepõem-se, ou sobre- põem-se parcialmente.
Preferivelmente, a sobreposição é menos que 10 nu- cleotídeos.
Preferivelmente, a seqüência de sonda corresponde a toda ou parte da seqüência entre cada um dos sítios de re- conhecimento da enzima de restrição primária de uma enzima restrição de primária e cada um dos primeiros sítios de re- conhecimento de enzima de restrição secundária vizinhos de uma enzima de restrição secundária.
Preferivelmente, cada sonda é pelo menos 25 mer.
Preferivelmente, cada uma das sondas é 25-60 mer.
Preferivelmente, as sondas são produtos de ampli- ficação PCR.
Preferivelmente, o arranjo compreende cerca de 300.000-400.000 sondas.
Preferivelmente, o arranjo compreende cerca de 385.000 ou mais sondas, preferivelmente, cerca de 750.000 sondas, mais preferivelmente, 6 x 750.000 sondas.
Preferivelmente, o arranjo compreende ou consiste em uma representação do genoma completo de uma dada espécie em baixa resolução.
Preferivelmente, uma a cada 2, 3, 4, 5, 6, 7, 8, 9 ou 10 sondas ordenadas em um padrão de cromossomo linear é contida no arranjo.
Preferivelmente, uma transição de freqüências da interação baixa para alta é indicativa da localização de um ponto de ruptura equilibrado e/ou desequilibrado.
Preferivelmente, um padrão inverso de freqüências da interação de DNA-DNA para a amostra do sujeito comparada com o controle é indicativo de uma inversão equilibrada e/ou desequilibrada.
Preferivelmente, uma redução na interação da fre- qüência de DNA-DNA para a amostra do sujeito comparada com o controle, em combinação com um aumento na interação de fre- qüência de DNA-DNA para regiões mais distantes, é indicativa de uma deleção equilibrada e/ou desequilibrada.
Preferivelmente, um aumento ou uma diminuição na freqüência de interação de DNA-DNA para a amostra ao suieito comparado com o controle é indicativo de uma duplicação ou inserção equilibrada e/ou desequilibrada.
Preferivelmente, cariotipagem espectral e/ou FISH é usado antes de realizar o dite método.
Preferivelmente, a doença é uma doença genética.
Preferivelmente, a doença é câncer.
Preferivelmente, as duas ou mais seqüências ampli- ficadas são diferencialmente marcadas.
Preferivelmente, as duas ou mais seqüências ampli- ficadas são identicamente marcadas quando as seqüências re- sidem em diferentes cromossomos.
Preferivelmente, as duas ou mais seqüências ampli- ficadas são identicamente marcadas quando as seqüências re- sidem no mesmo cromossomo a uma distância que é grande o bastante para mínima sobreposição entre interação de sinais de DNA-DNA.
Preferivelmente, em que o diagnóstico ou prognós- tico é diagnóstico ou prognóstico pré-natal.
Vantagens A presente invenção tem inúmeras vantagens. Estas vantagens ficam aparentes na descrição seguinte. A título de exemplo, a presente invenção é vanta- josa uma vez que ela fornece inter alia seqüências de nucle- otídeos, processos, sondas e arranjos comercialmente úteis. A título de exemplo adicional, a presente invenção é vantajosa uma vez que ela fornece a análise de alta produ- ção da freqüência de interação de duas ou mais seqüências de nucleotídeos no espaço nuclear. A titulo de exemplo adicional, a presente invenção é vantajosa uma vez que, usando tecnologia 3C convencionai, cada interação simples de DNA-DNA deve ser analisada per uma única reação de PCR contendo um único par de iniciadores.
Analise de alta produção e portanto possivei somente se o PCR for automatizado, mas o custo de tantos iniciadores será muito alto. Desta maneira, alta produção (genoma amplo) aná- lise de interações de DNA-DNA não é viável com tecnologia 3C convencional. Ao contrário, a presente invenção permite ago- ra a seleção simultânea de milhares de interações de DNA- DNA. Análise de alta produção de interações de DNA-DNA de acordo com a presente invenção aumentará bastante a escala e resolução de análise. A titulo de exemplo adicional, a presente invenção é vantajosa uma vez que, usando tecnologia 3C convencional, a seleção é voltada para as seqüências de DNA cujos oligonu- cleotídeos iniciadores foram designados, solicitados e in- cluídos na análise. A escolha de tais oligonucleotideos ini- ciadores é tipicamente com base no conhecimento concernente à posição, por exemplo, (distante) de sítios melhoradores e/cu outros sítios elementos/ nipersensívei reguladores que acredita-se serão reticulados com a sequência de nucleotí- ■aeos que está sendo investigada. Assim, 3C convencional é voltado para o projeto de iniciadores PCR que são incluídos na etapa de amplificação de PCR, ao passo que 4C não é vol- tado e pede ser usado para pesquisar o genoma completo para elementos de DNA de interação. Isto se dá em virtude de a ãmpij.ficavâu ue beqaejicids reuicuiadas rio 4C nâo ser baseada no conhecimento previsto de seqüêncías que reticulam com. a seqüência de nucleotídeos sendo investigada. Particularmen- te, em uma modalidade de 4C, sequências que reticulam com a Ό-ri rnio’ >"03 '-f'· iân'"· ^ n H ^ ^ ^ ·' —^ -ϊ —ϊ .—3 —Λ- v-·.·-..-}-·;,— — ‘ ΪΓ' ~ — — —* —* A ^-— '■t-·—\ v j. OCluCi ; J—· w t--U1 t_- a. diU^ J. J. ficaaas usando iniciadores PCR que nibriarzam para a seqüên- cia de nucleotídeos. Assim, a presente invenção permite uma seleção ampla de genoma não voltado para Interações de DNA- DNA. A título de exemplo adicional, a presente invenção é vantajosa porque usando tecnologia 3C convencional somente permite a amplificação seletiva de uma interação simples de DNA-DNA. Isto não é informativo quando hibridizado em um ar- ranjo. A tecnologia foi melhorada de maneira que todos os fragmentos que interagem com uma primeira seqüência de nu- cleotídeos (visada) sejam agora amplificados, por exemplo, amplificados seietivamente. A título de exemplo adicional, a presente invenção é vantajosa porque a tecnologia 4C pode ser usada para de- tectar aberrações genéticas balanceadas ou nâo balanceadas - tais como todos os tipos de translocações, deleções, inver- sões, duplicações e outros ré-arranjos genômicos - em ácido nucléico, por exemplo, cromossomos. Tecnologia 4C (que mede a proximidade de fragmentos de DNA) pode ainda determinar a predisposição de um sujeito para adquirir certas transloca- ções, deleções, inversões, duplicações e outros ré-arranjos genômicos (por exemplo, translocações, deleções, inversões, duplicações e outros ré-arranjos genômicos balanceados ou não balanceados) . Uma vantagem em relação às estratégias a- tuais é que não é necessário conhecer a posição exata da mu- dança em virtude de a resc.uçao de tecnologia 4C ser de ma- neira tal que eia pode ser usada para detectar ré-arranjos mesmo quando é '4C-bait' , definido pelos sítios de reconhe- cimento de enzima de restrição primária e secunaana que são analisados) é localizada tora (por exemplo, até uma megabase ou ainda mais) da mudança. Uma outra vantagem é que tecnolo- gia 4C permite o mapeamento preciso de mudanças, uma vez que ela pode ser usada para definir cs dois sítios de restrição (primária) entre os quais as mudanças ocorreram. Uma outra vantagem é que células não precisam ser cultivadas antes da fixação. Assim, tumores sólidos, por exemplo, podem também ser analisados por ré-arranjos genômicos. A título de exemplo adicional, a presente invenção é vantajosa em virtude de a tecnologia 4C poder também de- tectar mudanças (por exemplo, ré-arranjos) em um estado pré- maligno, isto é, antes de todas as células conterem estas mudanças. Assim, a tecnologia pode ser usada não somente no diagnóstico de doença, mas também no prognóstico de doença. A título de exemplo adicional, o desenho do arran- jo de acordo com a presente invenção é particuiarmente van- tajoso comparado com cs arranjes de iadrilhamento genômico existentes - tais como arranjos de Iadrilhamento genômico Nimblegen - uma vez que o desenho permite representação de uma parte muito grande do genema por arranjo simples. A tí- tulo de exemplo, para uma enzima de restrição que reconhece uma sequência de hexa-nucleotidees, cerca de 3 arranjos com cetca de 385.000 sondas cada serão suficientes cobrir, por exemplo, o genoma humano ou de camundongo completo. Para uma enzima de restrição que reconhece mais que 6 bp, um arranjo simples de cerca de 385.000 sondas pode ser usado para co- brir, por exemplo, o genoma humano ou de camundongo comple- to. /is v an L,age,.s cio ciesemo cio arranjo sac quei il; caca sonda é informativa uma vez que cada qual analisa um evento de ligação independente, facilitando muito a interpretação do resultado; e (2} uma grande representação do genoma pode ser localizada em um arranjo simples que é barato.
Tecnologia 4C pode ser vantajosamente usada para o mapeamento fino de ré-arranjos pouco caracterizados origi- nalmente detectados por abordagens citogenéticas (microsco- pia luminosa, FISH, SKY, etc.).
Tecnologia 4C pode ser vantajosamente usada para a seleção simultânea em um arranjo simples para combinações de ré-arranjos que ocorreram próximo aos múltiplos loci.
Descrição resumida das figuras Figura 1 O princípio da tecnologia 3C
Figura 2 (a) O princípio de uma modalidade de tecnologia 4C. Análise uC é realizada da maneira usual, como, por exem- plo, HindUI (H) como enzima de restrição. Após reversão de reticulações, a mistura de DNA conterá uma primeira seqüên- cia de nucleotídeos (visada) ligada a muitos fragmentos di- ferentes. Estes fragmentos serão amplificados e marcados u- sando métodos de amplificação - tal como PCR inverso - em por exemplo, círculos Dpnll, usando primeiramente iniciado- res específicos de seqüência de nucleotídeo (visados). Pro- dutos de amplificação marcados podem ser hibridizados com os arranjos aqui descritos. HindlII e Dpnll são dados como e- xemplos, mas outras combinações de enzimas de restrição - tais como 6 ou 8- e 4 ou 5-cortadores - podem também ser u- sadas. (b) Resultado de PCR separado por eletroforese de gel de duas amostras de fígado (Ll, L2) e cérebro (Bl, B2) fe- tais independentes, (c) Representação esquemática da locali- zação das sondas de microarranjo. Sondas foram projetadas em 100 bp de sítios HindII. Assim, cada sonda analisa um possí- vel parceiro de ligação.
Figura 3 Tecnologia 4C detecta o ambiente genômico de β- globina (cromossomo 7). Razões não processadas são apresen- tadas (sinais 4C para β-globina em HS2 divididos por sinais obtidos para amostra de controle) para sondas localizadas em regiões genômicas ~35 Mb em cromossomo de camundongo 10, 11, 12, 14, 15, 7 e 8 (do topo até a base; regiões apresentadas são em distância idêntica de cada centrômero corresponden- te) . Note o grande agrupamento de fortes sinais em torno do bait (globina) no cromossomo 7 (fileira 6) , que demonstra que tecnologia 4C detecta fragmentos genômicos próximo do padrão de cromossomo linear (de acordo com o fato de que freqüências da interação são inversamente proporcionais à separação do sítio genômico). Note que a região ligada em cis em torno do bait que apresenta altas intensidades de si- nal é grande (>5Mb), implicando, por exemplo, que transloca- ções podem ser detectadas mesmo com baits afastados mais que 1 MB do ponto de ruptura.
Figura 4 Tecnologia 4C detecta o ambiente genômico de Rad23A (cromossomo 8). Razões não processadas são apresenta- das (sinais 4C para Rad23A divididos por sinal obtido para amostra de controle) para sondas localizadas em regiões ge- nômicas de ~15 Mb ou mais em cromossomo de camundongo 10, 11, 12, 14, 15, 7 e 8 (do topo até a base; regiões apresen- tadas são em distância idêntica de cada centrômero corres- pondente) . Note o grande agrupamento de fortes sinais em torno do bait (Rad23A) no cromossomo 8 (fileira 7), que de- monstra que tecnologia 4C detecta fragmentos genômicos pró- ximo do padrão de cromossomo linear (de acordo com o fato que freqüências da interação são inversamente proporcionais à separação do sitio genômico). Note que a região ligada em cis em torno do bait que apresenta altas intensidades de si- nal é grande (>5Mb), implicando por exemplo que transloca- ções podem ser detectadas mesmo com baits afastados mais que 1 MB do ponto de ruptura.
Figura 5 Interações 4C de β-globina no cromossomo 7 (~135Mb) para um tecido de transcrição (fígado fetal) e um tecido de não transcrição (cérebro fetal) (analisado por uma abordagem de meio de corrida). Note que interações de longo alcance com β-globina diferem entre tecidos (provavelmente dependente do estado de transcrição do gene). Independente do tecido, fortes sinais 4C limitam uma grande região (>5 Mb1 em torno do bait. ÍT1-r; : >- ^ £ - - -3 ^ ^ Uros e Eraf interagem; com β-globina em células de fígado fetal. A abordagem 4C revela que dois genes, Eraf e Uros, interagem >30 Mb com e lecus β-globina localizado a- fastado -30 Mb. iscas auas interações foram previamente en- contradas por uma tecnologia diferente (Fluorescence In situ Hybridisation) descrito em Osborne et al. , Nature Genetics 36, 1065 (2004). Este exemplo mostra que interações de longo alcance detectadas pela tecnologia 4C podem ser verificadas por FISH e refletem verdadeiramente a proximidade nuclear.
Figura 7 Tecnologia 4C identifica precisamente transições entre regiões genômicas não relacionadas que são ligadas em cis. Para estes experimentos, foram usados camundongos transgênicos que contêm um cassete da região de controle de locus de β-globina humano (LCR) (~20 kb) inserido (por meio de recombinação homóloga) no locus Rad23A em cromossomo de camundongo 8. Tecnologia 4C foi realizada em fígados fetais E14.5 de camundongos transgênicos que foram homozigotos para esta inserção. Um fragmento HindIII no cassete da integração (HS2) foi usado como '4C-bait'. Os dados mostram que a tec- nologia 4C define precisamente tanto extremidades do cassete transgênico (fileira de base: somente as sondas no LCR huma- no (~20kb) dá sinais 4C e não scndas no restante de -380 kb da sequência de β-globina humano), e revela claramente a po- sição de integração em cromossomo de camundongo 8 (painel superior: comparar os sinais no cromossomo 8 (para posição de integração, ver seta) com sinais em 6 outros cromossomo de camundongos) (cromossomos completos são representados).
Este exemplo mostra que a tecnologia 4C pode ser usada para detectar a posição genômico de fragmentos de DNA etopicamen- te integrados (vírus, transgene, etc.). Ele mostra que tran- sições entre regiões genômicas não relacionadas que são li- gadas em cis podem ser identificadas precisamente, que podem ser usadas para identificar parceiros de pontos de ruptura genômico e localização.
Figura 8 Tecnologia 4C produz dados reprodutíveis, uma vez que o perfil para HS2 e β-globina são muito similares. Qua- tro experimentos 4C biologicamente independentes foram rea- lizados em fígados fetais E14.5, usando tanto o gene β- globina β-principal (2 fileiras superiores) quanto β-globina HS2 (base de duas fileiras) como o bait. Estes baits são ~40 kb separados no padrão de cromossomo linear mas mostraram previamente estar perto do espaço nuclear (Tolhuis et al., Molecular Cell 10, 1453 (2002)) Uma região -5 Mb é descrita em cromossomo de camundongo 7 que é 20-20 Mb fora do locus β-globina. Os dados mostram alta reprodutibilidade entre ex- perimentos independentes e demonstram que dois fragmentos perto do espaço nuclear compartilham parceiros de interação localizados em outro lugar no genoma.
Figura 9 A tecnologia 4C é aplicada para medir freqüências da interação de DNA-DNA com seqüência X (em cromossomo A) em células de uma pessoa saudável (topo) e um paciente com translocação (A;B) (base). Intensidades de sinal represen- tando freqüências da interação de DNA-DNA (eixo-Y) são colo- cadas em gráfico para sondas solicitadas em padrões de cro- mossomo lineares (eixo-X) Em células normais, interações de DNA-DNA freqüentes são detectadas em cromossomo A em torno da seqüência X. Em células de paciente, uma redução de 50 % nas freqüências da interação é observada para sondas em cro- mossomo A localizadas no outro lado do ponto de ruptura (BP) (comparar curva cinza (paciente) com linha preta (pessoa saudável) . Além do mais, o translocação traz parte do cro- mossomo B na proximidade física imediata para a seqüência X, e interações de DNA-DNA freqüentes são agora observadas para esta região no cromossomo B. A transição abrupta das fre- qüências da interação baixa para alta neste cromossomo marca a localização de seu ponto de ruptura.
Figura 10 Inversão(s) (balanceada(s)) podem ser detectadas pela tecnologia 4C. Parceiros inversos de freqüências da in- teração de DNA-DNA (medidos pela tecnologia 4C como intensi- dades de sinal de hibridização) são observados em sujeito doente (curva cheia) comparado com não doente (curva ponti- lhada), que revela a presença e tamanho da inversão.
Figura 11 Detecção de deleção(s) heterozigoto pela tecnolo- gia 4C. Sondas com freqüências da interação de DNA-DNA redu- zidas (medidas pela tecnologia 4C como intensidades de sinal de hibridização) em sujeitos doentes (curva cinza) comparado com não doentes (curva preta), revelam a posição e tamanho da região deietada. Sinais de hibridização residuais na re- gião deietada do sujeito doente proveniente de alelo intacto (deieção heterozigoto). Seleção é tipicamente acompanhada por um aumento nas intensidades de sinal para sondas locali- zadas diretamente além da região deietada (note que a curva cinza esta acima da cuiva preta no lado direito da deieção) , uma vez que estas regiões ficam em proximidade física imedi- ata com a sequência 4C (bait).
Figura 12 Duplicação detectada pela tecnologia 4C. Sondas com maiores sinais de hibridização em um paciente (curva cheia) comparadas com um sujeito normal (curva pontilhada) indicam a posição e tamanho de duplicação. Duplicação detec- tada pela tecnologia 4C é tipicamente acompanhada por meno- res sinais de hibridização em doente em função de sujeito não doente para sondas além da região duplicada (duplicação aumenta sua separação do sítio genômico da sequência 4C) .
Figura 13 Interações de longo alcance com β-globina revela- das pela tecnologia 4C. a, Razões não processadas de 4C so- bre sinais de hibridização de controle, revelando interações de β-globina HS2 ccm cromossomo 7 e dois cromossomos não re- lacionados (8 e 14) . b-c, Dados não processados para duas amostras de fígado fetal (topo, em vermelho) e cérebro fetal ‘base, em azul) independentes coiccados em gráfico junto com duas diferentes regiões 1-2 Mb em cromossomo 7. Agrupamentos altamente produtíveis de interações são observados tanto nas duas amestras de fígado fetal (b) quanto nas duas amostras de cérebro ■■ c .· . d-«, de meio de corrida para as mesmas regiões. Taxa de falsa descoberta foi ajustada em 5 % (linha pontilhada:, í, Representação esquemática de regiões de in- teração com β-globina ativa (fígado fetal, topo; e inativa (cérebro total, base; no cromossomo Ά £ x p/ L' 2Γ cii tí β-globína ativa e inativa interage com regiões cremossomais ativas e inativas, respectivamente, a, Compara- ção entre interações β-globina de longo alcance era fígado fetal (meio de corrida 4C, topo), análise de expressão de microarranjo em fígado fetal (escala log, meio) e a locali- zação de genes (base) colocados em gráfico junto com uma re- gião 4 Mb que contém o gene üros (30 Mb fora de β-globina), mostrando que β-globina ativa interage preferencialmente com outros genes ativamente transcritos, b, A mesma comparação em cérebro fetal em torno um agrupamento de gene OR locali- zado - 38 distante de globina, mostrando que β-globina ina- tiva interage preferencialmente com regiões inativas, c, Ca- racterização de regiões interagindo com β-globina em fígado fetal (esquerdo) e cérebro, (direito) em termos de teor do gene e atividade.
Figura 15 Rad23A unipresentemente expresso interage com re- giões ativas muito similares, em fígado e cérebro fetal, a, Representação esquemática de regiões em cromossomo 8 intera- gindo com Rad23A ativo em fígado fetal (topo, vermelho) e cérebro (base, azul), b, Comparação entre interações Rad23A de longo alcance (meio de corrida 4C) e análise de expressão de microarranjo (escala icg em fígadc fetal de dois painéis', interações Rad23A de longo alcance (meio de corri- da 4C) e análise de expressão de rr.icroarran j o (escala icg) em cérebro fetal (painel 3 e 4) e a localização de genes (painel inferior) colocados em gráfico junto com uma região c Mb de cromossomo 6. c, Caracterização de regiões intera- gindo com Rad23A em fígadc (esquerdo) e cérebro (direito) fetal em termos de teor de gene e atividade.
Figura 16 Cryo-FISH confirma que tecnologia 4C identifica verdadeiramente regiões de interação, a, exemplo de parte de uma seção cryo (200 nm) mostrando mais que 10 núcleos, al- guns dos quais contendo o locus β-globina (verde) e/ou Uros (vermelho). Por causa do seccionamento, muitos núcleos não contêm sinais para esses dois loci. b-d, exemplos de sinais sobrepostos completamente (b) e parcialmente (c) e sinais de contato (d) , que foram todos pontuados como positivo para interação, e-g, exemplos de núcleos contendo em alelos de não contato (e-f) e um núcleo contendo somente β-globina (g) , que foram todos pontuados como negativos para intera- ção. Representação esquemática de resultado cryo-FISH. Por- centagens de interação ccm β-gicbma (h) e Rad23A (i) são indicadas acima dos cromossomos para regiões positivamente identificadas (ponta de flecha vermelha) e negativamente i- dentificadas (ponta de flecha azul) pela tecnologia 4C. Os mesmos BACs foram usados para os dois tecidos. Freqüências da interação medidas por cryo-FISH entre dois agrupamentos de gene OR distantes em fígado fetal e cérebro são indicados acaixo aos cromossomos.
Figura 17 Análise 1U de HS2 e β-prmcipal deu resultado ai- tamente similar. (a( Dadcs 4C não processadas de quatro a- mcstras ao ligaao Ξ*4 . u maeper.der.tas apresentaram um padrão muito similar ae interação com HSz »topo; e b-Drincioai ;ba- se} . (b) Um Existe uma grande sobreposição entre sondas pon- tuadas positivo para interação no experimento HS-2 e sondas que pontuam positivo para interação no experimento β- principal.
Figura 18 Uma comparação entre interações em cis e em trans. (a) Dados 4C não processados de dois experimentos indepen- dentes mostrando interações β-globina com uma região positi- vamente identificada em cis (cromossomo 7, topo) e uma regi- ão em trans contendo o locus α-globina (chr.ll, base}, (b) Dados 4C não processadas de dois experimentos independentes mostrando interações Rad23A com uma região positivamente i- dentificada em cis (cromossomo 8, topo) e uma região em trans que aparece em tepo quando classificada de acordo com o maior valor do meio de corrida. Nenhuma das regiões em trans atendeu as condições rigorosas que permitiram a iden- tificação de regiões de longa interação em cis.
Figura 19 Regiões que interagem com β-globina também fazem contato frequentemente umas com as outras. Duas regiões (se- paradas uma da outra quase 60 Mb) , contendo genes ativamente transcritos e identifiçadas pela tecnologia 4C para intera- gir com β-globina em fígado fetal, mostraram freqüências de co-localização por cryo-FISH de 5,5 %, que foi significati- vamente mais que as freqüências de co-localização de fundo.
Descrição detalhada da invenção Tecnologia 3c 0 método 3C foi descrito com detalhe em Dekker at al. (2002), Tolhuis at al. (2002), Palstra at al. (2003), Splinter at al. (2004) and Drissen at al. (2004). Resumida- mente, 3C é realizado digerindo DNA reticulado com uma enzi- ma de restrição primária seguido por ligação em concentra- ções de DNA muito baixas. Nestas condições, ligação de frag- mentos reticulados, que é intramolecular, é fortemente favo- recida em relação a ligação de fragmentos aleatórios, que é intermolecular. A reticulação é em seguida revertida, e pro- dutos de ligação individuais são detectados e quantificados pela reação da cadeia polimerase (PCR) usando iniciadores específicos de locus. A freqüência da reticulação (X) de dois loci específicos é determinada por reações PCR quanti- tativas usando controle,e padrões reticulados, e X é expres- so como a razão da quantidade do produto obtido com o padrão reticulado e com o padrão de controle.
De acordo com a presente invenção, um padrão 3C é preparado usando os métodos descritos por Splinter et at., (2004) Methods Enzymol. 375, 493-507. (isto é, fixação de formaldeído, digestão de enzima de restrição (primária), ré- ligação de fragmentos de DNA reticulados e purificação de DNA). Resumidamente, uma amostra - tal como células, tecidos ou R núcleos - é fixada usando um agente de reticulação - tal como formaldeído. A digestão de enzima de restrição pri- mária é em seguida realizada de maneira que o DNA é digerido no contexto dos núcleos reticulados. Ligação intramolecular é em seguida realizada em baixas concentrações de DNA (por exemplo, cerca de 3,7 ng/pL), que favorece ligação entre fragmentos de DNA reticulados (isto é, ligação intramolecu- lar) relacionados a ligação entre fragmentos de DNA não re- ticulados (isto é, ligação intermolecular ou aleatória). Em seguida, as reticulações são revertidas e o DNA pode ser pu- rificado. 0 padrão 3C que é produzido contém fragmentos de restrição que são ligados em virtude de eles estarem origi- nalmente perto do espaço nuclear.
Uma vez que uma enzima de restrição primária é u- sada para digerir o DNA antes da etapa de ligação intramole- cular, um sitio de reconhecimento de enzima para a enzima de primária restrição separará a primeira seqüência de nucleo- tídeos (visada) e a seqüência de nucleotideos que foi liga- da. Desta maneira, o sitio de reconhecimento primário é lo- calizado entre a primeira seqüência de nucleotideos (visada) e a seqüência de nucleotideos ligada (isto é, a segunda se- qüência ligada).
Seqüência de nucleotideos A presente invenção envolve o uso de seqüências de nucleotideos (por exemplo, padrão 3Cs, padrão 4Cs, padrões de DNA, padrões de amplificação, fragmentos de DNA e DNA ge- nômico), que podem ser disponíveis em bases de dados. A seqüência de nucleotideos pode ser DNA ou RNA de origem genômica, sintética ou recombinante, por exemplo, cD- NA. Por exemplo, seqüências de nucleotídeos recombinantes podem ser preparadas usando técnicas de clonagem PCR. Isto envolverá fazer um par de iniciadores flanquear uma região da seqüência a qual se deseja clonar, colocar os iniciadores em contato com mRNA ou cDNA obtido, por exemplo, de um mamí- fero (por exemplo, célula animal ou humana) ou célula não mamífero, desenvolver uma reação da cadeia polimerase (PCR) em condições que realizam amplificação da região desejada, isolar o fragmento amplificado (por exemplo, purificando a mistura da reação em um gel de agarose) e recuperar o DNA amplificado. Os iniciadores podem ser projetados para conter sítios de reconhecimento de enzima de restrição adequados para que o DNA amplificado possa ser clonado em um vetor de clonagem adequado. A seqüência de nucleotídeos pode ser fita dupla ou fita única, quer representando a fita de sentido como anti- sentido, ou suas combinações.
Para alguns aspectos, prefere-se que a seqüência de nucleotídeos seja DNA de fita única - tais como iniciado- res de fita única e sondas.
Para alguns aspectos, prefere-se que a seqüência de nucleotídeos seja DNA de fita dupla - tais como padrões 3C e 4C de fita dupla.
Para alguns aspectos, prefere-se que a seqüência de nucleotídeos seja DNA genômico - tais como um ou mais lo- ci genômicos.
Para alguns aspectos, prefere-se que a seqüência de nucleotídeos seja DNA cromossômico. a seqüência de nucleotideos pode comoreenaer uma crimeira seqüência de nucleotideos (visada) e/ou uma segunda seqüência de nucleotideos.
Cs sities de reconhecimento de enzima de restrição primária e secundária serão diferentes uns dos outros e o- correrão tipicamente semente uma vez na seqüência ae nucieo- tideos.
Em um aspecto, é fornecida uma seqüência de nucle- otídeos circularízada que compreende uma primeira seqüência de nucleotideos e (por exemplo, ligada a) uma segunda se- qüência de nucleotideos separadas (por exemplo, divididas, ou partidas) por um sitio de reconhecimento de enzima de restrição primária e uma secundária, em que a dita primeira seqüência de nucleotideos é uma seqüência de nucleotideos alvo e a dita segunda seqüência de nucleotideos é obtenível reticulando DNA genômico (por exemplo, in vivo ou in vitro).
Os sítios de reconhecimento de enzima de restrição primária e secundária serão diferentes uns dos outros e ocorrerão ti- picamente somente uma vez na seqüência de nucleotideos.
Em um aspecto adicional, é fornecida uma seqüência de nucleotideos circularizada que compreende uma primeira seqüência de nucleotideos e (por exempio, ligada) uma segun- da seqüência de nucleotideos separada (por exemplo, dividi- da, ou partida) por um sítio de reconhecimento de enzima de restrição primária e uma secundária, em que a dita primeira seqüência de nucleotideos é uma seqüência de nucleotideos alvo e em que a dita primeira e segunda sequências de nucle- otideos são obteníveis por um processo que compreende as e- -μ- ~ ^ . .. Λ . +- . , Λ '“λ*’ τ\ Λ - -J - /.--- - - ·* - .· ' ■' ·.··· · ■ ’ _ .J. iL ·_Λ l_, ■J'- \ ^ j j-L-i ^ uj. ^nn ac \ [^ui cλ.ϊ^j.u^j .1 ^ ^ _lh v í v u ou in vitro) ; vb', digerir o CNA reticulado com uma enzima de restrição primária; ic) ligar as sequências de nucleotideos re ticuladas; (d; reverter a ret iculação; e (e) digerir as sequências de nucleotideos com uma encima de restrição se- cundária para circularirar as seqüências de nucleotideos .
Preferivelmente, a segunda seqüência de nucleoti- deos cruza (por exemplo, corta) a primeira seqüência de nu- cleotideos (visada) . Desta maneira, a seqüência de nucleoti- deos compreende a segunda seqüência de nucleotideos, que se- para a primeira seqüência de nucleotideos (visada) em duas porções ou fragmentos - tal como aproximadamente duas por- ções igualmente dimensionadas ou fragmentos. Tipicamente, as porções ou fragmentos terão pelo menos cerca de 16 nucleoti- deos de comprimento.
Primeira seqüência de nucleotideos A primeira seqüência de nucleotideos é uma seqüên- cia de nucleotideos alvo.
Da maneira aqui usada, o termo "seqüência de nu- cleotideos alvo" refere-se a seqüência que é usada como uma seqüência bait a fim de identificar uma ou mais seqüências ao qual ela reticula (por exemplo, uma ou mais seqüências de nucleotideos de interesse ou uma ou mais seqüências de com- posição de seqüência de nucleotideos desconhecida). A seqüência de nucleotideos alvo é de seqüência conhecida.
Reticulação é indicativo de que a seqüência de nu- cleotideos alvo e a seqüência reticuiada a eia estavam ori- oinaiment.e próx^s' '"ο espaçe nuclear. Ectcrmunar.do 5c a freqüência para que sequências fiquem próximas umas das ou- -ras, é pessívei entender, por exemplo, a conformação de cromossomos e regiões crcmossomais no contexto espacial dc núcleo (por exemplo, in vivo ou in vifro' . Al ém. do- ma i s, o dossIv®l en-opder as organizações estrutura rs oonlusas no ger.cma, por exemplo, quando melhoradores ou outros elementos reguladores transcricionais comunicam com promotores distan- tes localizados em cis ou mesmo em trans. Além do mais, é ainda possível entender o posicionamento de uma dada região genômica em relação às seqüências de nucleotídeos presentes no mesmo cromossomo (em cis) bem como a seqüências de nucle- otídeos em outros cromossomos (em trans). Assim, é possível mapear seqüências de nucleotídeos em diferentes cromossomos que freqüentemente compartilham sítios no espaço nuclear.
Além do mais, é ainda possível detectar aberrações genéticas equilibradas e/ou desequilibradas - tais como translocações, deleções, inversões, duplicações e outros ré-arranjos genô- micos equilibrados e/ou desequilibrados (por exemplo, dele- ções ou translocações em um ou mais cromossomos) . A este respeito, aberrações genéticas resultam em mudanças nas in- terações de DNA-DNA na posição que a mudança ocorreu, que pede ser detectada. A primeira seqüência de nucleotídeos (visada) de acordo com a presente invenção pode ser qualquer seqüência em que se deseja determinar a freqüência de interação no es- paço nuclear com uma ou mais outras seqüências.
Em uma modalidade, a primeira seqüência de núcleo- tídeos (visada) terá mnc que cerca de 23C bp de comprimen- to, uma vez que uma enzima de restrição secundária è esco- lhida que corta a primeira sequência de nucleotídeos (visa- da' a cerca de 350 bp ou mais dc sítio de restrição primá- rio. isto pode minimizar a propensão a formação de ju- culo, por causa das restrições topológicas (Rippe et al. (2001) Trends em Biochern. Sciences 26, 733-40) . Adequada- mente, a primeira seqüência de nucleotídeos (visada) após a amplificação compreende pelo menos cerca de 32 bp pelo fato de que o comprimento mínimo de pelo menos dois iniciadores de amplificação usados para amplificar a segunda seqüência de nucleotídeos ser cerca de 16 bases cada.
Em uma modalidade preferida, a primeira seqüência de nucleotídeos (visada) pode compreender completamente ou parcialmente (por exemplo, um fragmento), ou estar perto de (por exemplo, nas proximidades de) um promotor, um intensi- ficador, um silenciador, um isolante, uma região de anexação de matriz, uma região de controle de locus, uma unidade de transcrição, uma origem de replicação, uma recombinação de ponto de acesso, am ponto de ruptura de translccação, um centrômero, um telômero, uma região densa em genes, uma re- gião fraca de gene, um elemento repetitivo, um sítio de in- tegração (viral), uma seqüência de nucleotídeos em que dele- ções e/ou mutações são relacionados com um efeito, por exem- plo, doença, efeito fisiológico, funcional ou estrutural - tal como um SNP (pelimorfismo nucleotídeos simples), ou se- qüência (s) de nucleotídeos contendo tais deleções e/ou muta- ções, ou qualquer seqüência em que se deseja determinar a freqüência de interação no espaço nuclear com outras seqüên- cias.
Da maneira supramencionada, a primeira seqüência de nucleotideos (visada) pode compreender completamente ou parcialmente (por exemplo, um fragmento), ou estar perto de (por exemplo, nas proximidades) uma seqüência de nucleoti- deos em que aberrações genéticas - tais como deleções e/ou mutações - são relacionadas a um efeito (por exemplo, uma doença). De acordo com esta modalidade da invenção a primei- ra (seqüência de nucleotideos alvo) pode portanto ser uma seqüência de nucleotideos (por exemplo, um gene ou um lo- cus) , adjacente (no padrão de DNA físico), ou na região ge- nômica em que mudanças foram associadas ou correlacionados com uma doença - tal como uma doença genética ou congênita.
Em outras palavras, a primeira seqüência de nucleotideos (visada) pode ser, ou pode ser escolhida com base na sua as- sociação com um fenótipo clínico. Em uma modalidade preferi- da, as mudanças são mudanças em um ou mais cromossomos, e a doença pode ser como uma conseqüência, por exemplo, de uma ou mais deleções, uma ou mais translocações, uma ou mais du- plicações e/ou uma ou mais inversões, etc.
Exemplos não limitantes de tais genes/loci são A- ML1, MLL MYC, BCL, BCR, ABL1, imunoglobulina loci, LYL1, TAL1, TAL2, LM02, TCR a/δ, TCRβ, HOX e outros loci em várias leucemias linfoblásticas.
Outros exemplos são descritos em bases de dados eletrônicos - tais como: eancerchromoscmes http: //cgap.ne i.nih. gc v/Chrcmos ct.e s />ii t e Ima http://www.prcgenetix.net/progenetix/P14603437/ide oaram . htrm Γ". _ ■_ o . ..·■ , /¾ Λ v\ , .di , vjíjl C: v C . coi// ''v J “ hx “'J ^ ^ ’ v- w / y O _1_ > pl?query=47,xy http://www.possum.net.au/ http://www.Imdatabases.com/ http://www.wiley.com/legacy/products/subj ect/lífe/ borgaonkar/index.html http ://www.ncbi.nlm.nih. gov/entrez/query.fcgi?
db=0MIM http: //www.sanger.ac.uk/PostGenomics/decipher/ http://agserverOl,azn.nl:8080/ecaruca/ecaruca.Jsp Outros exemplos são descritos em "Catalogue of un- balanced Chromosome Aberrations in Man" 2nd edition. Albert Schiuzel. Berlin: Walter of Gruyter, 2001. ISBN 3-11-011607- 3.
Em uma modalidade, o termo "adjacente" significa "diretamente adjacente", de maneira que não haja nucleotí- deos interferentes entre duas sequências adjacentes.
Em uma outra modalidade, o termo "adjacente", no contexto da seqüência de ácido nucléico e do sitio de reco- nhecimento da enzima de restrição primária, significa "dire- tamente adjacente", de maneira que não haja nucleotideos in- terferentes entre a seqüência de ácido nucléico e a sitio de reconhecimento de enzima de restrição primário.
Segunda seqüência de nucleotideos. A segunda seqüência de nucleotideos é obtenível, obtida, identificada, ou identificável para reticular DNA genômico de (por exemplo, ín vivo ou in vitro) . A segunda seqüência de nucleotideos (por exemplo, seqüência de nucleotideos de interesse) torna-se ligada à primeira seqüência de nucleotideos (visada) após tratar uma amostra com um agente de reticulação e digerir/ligar os fragmentos de DNA reticulados. Tais seqüências são reticula- das na primeira seqüência de nucleotideos (visada) em virtu- de de eles estarem originalmente perto no espaço nuclear e ligados à primeira seqüência de nucleotideos (visada) em virtude das condições de ligação favorecerem ligação entre fragmentos de DNA reticulados (intramolecular) nos eventos de ligação aleatória.
Doenças com base nas alterações - tais como trans- locações, deleções, inversões, duplicações e outros ré- arranjos genômicos - são de maneira geral causadas por inte- rações de DNA-DNA aberrantes. Tecnologia 4C mede freqüências de interação de DNA-DNA, que primeiramente são função da se- paração do sítio genômico, isto é, freqüências de interação de DNA-DNA são inversamente proporcionais à distância linear (em quilobases) entre dois loci de DNA presentes no mesmo padrão de DNA físico (Dekker et ai., 2002). Assim, altera- ção (s) que cria(m) fisicamente novos e/ou diferentes padrões de DNA, é(são) acompanhada(s) por interações de DNA-DNA al- teradas, e isto pode ser medido pela tecnologia 4C.
Adequadamente, a segunda seqüência de nucleotideos L· c: IL i U ttí .1 tj i ί l i \ u i 4U d ú_ cr cç, O td UaSe .
Agentes de reticulação - ta_ como ferma Ideido - podem ser usados para reticular proteínas em outras proteí- nas e ácido nucléico vizinhos. Assim, duas ou mais seqüên- oe proteínas üjaaas a j uiua ue, estas sequências cie xiacieo— tídeos. Agentes de reticulação sem ser fcrmaldeídc pedem também ser usados de acordo com a presente invenção, inclu- indo os agentes de reticulação que reticulam diretamente se- qüências de nucleotídeos. Exemplos de agentes que reticulam DNA incluem, mas sem limitações, luz ÜV, mitomicina C, ni- trogênio mustarda, melfalano, diepóxido de 1,3 butadieno, cis diaminadicloroplatina(II) e ciclofosfamida.
Adequadamente, o agente de reticulação formará re- ticulados que ligarão distâncias relativamente pequenas - tal como cerca de 2 Â - selecionando assim interações ínti- mas que podem ser revertidas.
Reticulações podem ser realizadas, por exemplo, para incubar as células em formaldeido 2 % a temperatura am- biente - tal como para incubar células 1 x 10' em 10 mL de DMEM-10 % FCS suplementado com formaldeido 2 % por 10 minu- tos à temperatura ambiente.
Enzima de restrição primária Da maneira aqui usada, o termo "enzima de restri- ção primária" refere-se a uma primeira enzima de restrição que é usada para digerir o DNA reticulado. A enzima de restrição primária será escolhida de- pendendo do trpo de sequência visada (por exemplo, locus) a ser snalisada. Dcse j a-cc que experimentos preliminares sejam reaiezades pcijid et_m i z a r ss ccndiçoês de digestão. A enzima de restrição primária pode ser seleciona- da de enzimas de restrição que reconhecem pelo menos seqüên- ,"' e p; <2. £ ρ;Ί~ Γ; ’J_ rp gj Ϊ ς A
wj 4 4 l i. ·. C-n Ο --A. tt r_ »-b ·. - -i— —1_ o i» ti i—■ *^· » f i i tw-· a- L l i v ’·^ 'sA t_. 1 a. c_. _L C3. ^ O bo de DNA incluem, mas sem limitações, AcII, HindII, SspI, BspLUIII, Agel, MIuI, Spel, Bglli, Eco47III, StuI, Seal, Ci- ai, AvalII, VspI, MfeI, PmaCI, PvuII, Ndel, Ncol, Smal, Sa- cll, Avrll, Pvul, Xmall, SpII, Xhol, PstI, AflII, EcoRI, Aa- tll, Saci, EcoRV, Sphl, Nael, BsePI, Nhel, BamHI, NarI, A- pal, Kpnl, Snal, Sall, ApaLI, Hpal, SnaBI, BspHI, BspMII, NruI, Xbal, Bell, MstI, Bali, Bspl407I, Psil, AsuII e Ahall- I.
Enzimas de restrição que reconhecem mais que uma seqüência 6 bp de DNA incluem, mas sem limitações, BbvC I, Asei, AsiS I, Fse I, Not I, Pac I, Pme I, Sbf I, SgrA I, Swa I, Sap I, Cci NI, FspA I, Mss I, Sgf I, Smi I, Srf I e Sse8387 I.
Para alguns aspectos da presente invenção, no caso de enzimas de restrição reconhecerem sequências 6 bp, Bglli, HindIII ou EcoRI são preferidos. 0 termo "sítio de reconhecimento de enzima de res- trição primária" refere-se ao sítio em uma seqüência de nu- clectídeos que é reconhecida e clivada pela enzima de res- trição primária.
Enzima de restrição secundária Da maneira aqui usada, o termo "enzima de restri- _ V J. vj Γ O '-1 VJ, .l l l Ol Ç_ J. J .: LJ.1Í.C1 \_A 'w — CíU0 Θ U 5 â G d apC8 5. dlc6StâC dê βΓΊΖΙΓΓΙά. Q0 IcStlICãO ρΓ,ΕΓΓιάΙΓ-^α, iigaçãc de DNA reticuiddo, des-reticulação e purificação ae DNA (opcional) . Em uma modalidade, a enzima de restrição se- "· · i τΛ H d ν' ’ d ¢8 i 1 c: z, i “1 — >-·. ç; v 3 Ρλ /'r ρ'-ό r r^-y— ν-'Οϊτ-τ-ι-ι,H j2s P1 V ^ Z j . c czS Ξ· ~ ■ G ^ tr G v,- _. zx ^ uC ^ — J“vi cie -..iç-j-cí í c / pc_u; e a ligação de seqüências de composição de nucieotídeos conhe- cida nos sítios de reconhecimento de enzima de restrição se- cundária que flanqueiam as seqüências de nucieotídeos de in- teresse.
Em uma modalidade, ligação de seqüências de compo- sição de nucieotídeos conhecida com os sítios de reconheci- mento de enzima de restrição secundária que flanqueiam (por exemplo, estão de cada lado ou extremidade) as seqüências de nucieotídeos de interesse envolvem ligação em condições di- luídas para favorecer a ligação intramolecular entre os sí- tios de reconhecimento de enzima de restrição secundária que flanqueiam seqüências de nucieotídeos visadas e as seqüên- cias de nucieotídeos de interesse ligadas. Isto resulta efe- tivamente na formação de círculos de DNA em que seqüências de nucieotídeos visadas conhecidas flanqueiam seqüências de interesse desconhecidas.
Em uma outra modalidade, ligação de seqüências de composição de nucieotídeos conhecida com os sítios de reco- nhecimento de enzima de restrição secundária que flanqueiam (por exemplo, estão de cada lado ou extremidade) as seqüên- cias de nucieotídeos de interesse envolvem a adição de se- qüências de DNA únicas de composição de nucieotídeos conhe- -, _v_ vi. I_< f V .J l--* _k_ _L_ _L_ V_^ Cl íÇl ^—-■ V. 1 L L V_J v V 'vi ■ '■ _, - Cr^ V_. ^ ^_J 'vi bt _1_ C^i \J 'c 1_ ’■_- 's,_- L ί '. . -U -U C^ Cl vão intermclecular enire os sities de reconhecimento de en- cima de restrição secundária que franqueiam as sequências de r.ucleotídeos de interesse e introduzem seqüências de DNA ú- Em uma outra modalidade, a enzima de restrição secundá- ria é escolhida de maneira que nenhum sitio de enzima de restrição secundária fique em cerca de 350 bp (por exemplo, 350-400 bp) do sítio de restrição primário.
Em uma outra modalidade, a enzima de restrição se- cundária é escolhida de maneira que o mesmo sítio de enzima de restrição secundária é provavelmente para ser localizada na sequência de nucleotideos ligada (isto é, a seqüência re- ticulada ligada) . Uma vez que as extremidades da primeira seqüência de nucleotideos (visada) e da seqüência de nucleo- tídeos ligada podem ser extremidades compatíveis coesivas (ou rombas), as seqüências podem ainda ser ligadas a fim de circularizar o DNA. Desta maneira, a etapa de digestão é se- guida por ligação em condições diluídas que favorecem inte- rações intramoleculares e circularização opcional do DNA por meio das extremidades compatíveis.
Preferivelmente, o sitio de reconhecimento da en- zima de restrição secundária é um sítio de reconhecimento de seqüência de nucleotideos de 4 ou 5 bp. Enzimas que reconhe- cem seqüências de DNA de 4 ou 5 bp incluem, mas sem limita- ções, TspEI, MaelI, Alui, NlalII, Hpall, FnuDII, Mael, Dpnl, Mbol, Hhal, HaelII, Rsal, Taql, CviRI, Msel, Sthl32l, Acil, Dpr.II, Sau3AI e MnlI.
Em uma modalidade preferida, a enzima de resLrigão secundária é NlalII e/ou Dpnll. 0 termo "sitio de reconheci- mento de enzima de restrição secundária" refere-se ao sitio na seqüência de nucieotídeos que é reconhecida e clivada pe- 1_3. G G IGSÇlÍ^ãO S S ^ Ί Z CÍ á ί ·” Αρό3 a digestão ccm a enzima de restrição secunda- ria, uma reação adicional da ligação é realizada. Em uma mo- dalidade,' esta reação da ligação liga as sequências de DNA de composição de seqüência de nucieotídeos conhecidas com o sítio de digestão da enzima de restrição secundária de uma ou mais sequências que são ligadas à seqüência de nucleotí- deos alvo.
Enzima de restrição terciária Da maneira aqui usada, o termo "enzima de restri- ção terciária" refere-se a uma terceira enzima de restrição que pode ser opcionalmente usada após a etapa de enzima de restrição secundária a fim de linearizar DNA circularizado antes da'amplificação.
Preferivelmente, a enzima de restrição terciária é como enzima que reconhece um sítio de reconhecimento de 6 bp ou mais nucieotídeos. Preferivelmente, a enzima de restrição terciária digere a primeira seqüência de nucieotídeos {visa- da) entre sítio de enzima de restrição primária e secundária de reconhecimento. Como entendido pelos versados na técnica, é desejável que a enzima de restrição terciária não digira a primeira seqüência de nucieotídeos (visada) muito perto dos sítios de reconhecimento de enzima de restrição primária e secundária de maneira que os iníciadores de amplificação não O^^Sculi iiicij_S i x _L .D i. ± Ci ^ Z d. L . uc s Ld ihcii it j_ L ò. r Cjuct 'Ό S J, ““ tio de restrição de reconhecimento de enzima terciária seja localizado pelo menos a mesma distância dos sítios de reco- nhecimento de enzima de restrição primária e secundária que -Ί ^ ;Cj cç ·οϊ >- ^ Ί ^ d ~J no ri-' Çj γ- ^ 4 v- ^ -T - Cl c? inxciddoxes de amplificação possam ainda hibridizar.
Em uma modalidade preferida, a enzima de restrição terciária é uma que reconhece uma seqüêncía de 6-bp de DNA. 0 termo "sítio de reconhecimento de enzima de restrição ter- ciária" refere-se ao sítio na seqüêncía de nucleotídeos que é reconhecida e clivada pela enzima de restrição terciária. Sítio de reconhecimento Endonucleases de restrição são enzimas que clivam a espinha dorsal açúcar-fosfato de DNA. Em cenários mais práticos, uma dada enzima de restrição corta ambas fitas de DNA duplex em um trecho de apenas umas bases. Os substratos para enzimas de restrição são seqüências de DNA de fita du- pla denominadas sítios/seqüências de reconhecimento. 0 comprimento de sítios de reconhecimento de res- trição varia, dependendo da enzima de restrição que é usada. 0 comprimento da seqüêncía de reconhecimento dita com que freqüência a enzima cortará uma seqüêncía de DNA. A título de exemplo, inúmeras enzimas de restrição reconhecem uma seqüêncía de DNA de 4 bp. As seqüências e a enzima que reconhecem a seqüêncía de DNA de 4 bp incluem, mas sem limitações, AATT (TspEI), ACGT {MaelI), AGCT (Alui), CATG (NlalII CCGG (Hpall), CGCG (FnuDII), CTAG (Mael), GATC (Dpnl, Dpnll, Sau3AI & Mbol), GCGC (Hhal), GGCC (HaelII), o l AC i Ksa Ϊ : , j l.ijA iidqli, iGlm ιυνικι t , ii A A (Hst± ; , CCCG íSthl.321', CCGG ÚAcil' e CCTC CMnl:} A titulo de exemplo adicional, inúmeras enzimas de restrição reconhecem uma seqüência de DNA de 6 bp. As se- a-'3*1· 1J 53 α -c.. - -d-- - ~ AC C d S O c b de PM A ínciücin, ma s sem -Limitações, ruíC ο 11 \ Ac 11; , AíjC j. j. í HindI11) , AATATT (SspI), ACATGT (BspLUllI), ACCGGT (Agel), ACGCGT (MluI), ACTAGT (Spel), AGATCT (BglII), AGCGCT (E- co4 7111 }, AGGCCT (StuI), AGTACT (Seal), ATCGAT (Ciai), ATG- CAT (AvalII), ATTAAT (VspI), CATATG (MfeI), CACGTG (PmaCI), CAGCTG (PvuII), CATATG (Ndel), CCATGG (Ncol), CCCGGG (SmaL) CCGCGG SaciI), CCTAGII), CTCGAG (Xhol), CTGCAG (PstI), CTTA- AG (AfIII), GAATTC (EcoRI), GACGTC (Aatll), GAGCTC (Saci), GATATC (EcoRV), GCATGC (Sphl), GCCGGC (Nael), GCCGGC (Bse- PI), GCTAGC (Nhel), GGATCC (BamHI), GGCGCC (Narl), GGGCCC
(Apal), GGTACC (Kpnl), GTATAC (Snal), GTCGAC (Sall), GTCGAC (ApaLI), GTTAAC (Hpal), TACGTA (SnaBI), TCATGA (BspHI), TCCGGA (BspMII), TCGCGA (NruI), TCTAGA (Xbal), TGATCA (Bcl- I), TGCGCA (Mstll), TGGCCA (Bali), TGTACA (Bspl407l), TTATAA (PsiI), TTCGAA (AsuII) e TTTAAA (AhalII). A título de exemplo adicional, inúmeras enzimas de restrição reconhecem um 7 bp seqüência de DNA. As seqüências e a enzima que reconhecem a seqüência de 7 bp de DNA inclu- em, mas sem limitações, CCTNAGG (Saul), GCTNAGC (EspI), GGT- NACC BstEII e TCCNGGA Pfol. A titulo de exemplo adicional, inúmeras enzimas de restrição reconhecem uma seqüência de 8 bp de DNA. As se- qüências e a enzima que reconhecem a seqüência de 8 bp de DNA incluem, mas sem limitações, ATTTAAAT (Swal), CCTGCAGG
(Sse83871), CGCGGGCG (Sse2321), CGTCGACG (SgrDI), GCCCGGGC (SrfI), GCGATCGC (Sgfl), GCGGCCGC (Notl), GGCCGGCC (Fsel), GGCGCGCC (Asei), GTTTAAAC (Pmel) e TTAATTAA (PacI).
Inúmeras dessas enzimas contêm a seqüência CG que podem ser metiladas in vivo. Inúmeras enzimas de restrição são sensíveis a esta metilação e não clivarão a seqüência metilada, por exemplo, Hpall não clivará a seqüência CCmGG, ao passo que seu isosquizômero MspI é insensível a esta mo- dificação e clivará a seqüência metilada. Desta maneira, em alguns casos, as enzimas sensíveis a metilação eucariótica não são usadas.
Em uma modalidade, um sítio de reconhecimento é um sítio de digestão.
Em uma modalidade, um sítio de reconhecimento de enzima de restrição é um sítio de digestão de enzima de res- trição .
Circularização De acordo com uma modalidade da presente invenção, o material para 4C é preparado criando círculos de DNA dige- rindo o padrão 3C com uma enzima de restrição secundária, seguido por ligação.
Preferivelmente, é escolhida uma enzima de restri- ção secundária que corta a primeira seqüência de nucleotí- deos (visada) em mais que cerca de 350 bp (por exemplo, 350- 400 bp) do sítio de restrição primário. Vantajosamente, isto minimiza a propensão de formação de círculo por causa das restrições topológicas (Rippe et al. (2001) Trends in Bío- chem. Sciences 26, 733' 40) .
Preferivelmente, a enzima de restrição secundária é um cortador freqüente que reconhece um sitio de reconheci- mento de enzima de restrição de 4 ou um 5 bp. Assim é possí- vel obter fragmentos de restrição menores para eficiências iguais de amplificação de todos os fragmentos ligados duran- te a amplificação.
Antes da ligação e digestão da enzima de restrição secundária, o padrão de DNA compreenderá um sítio de reco- nhecimento de enzima secundária na primeira seqüência de nu- cleotídeos (visada) localizada a mais que cerca de 350-400 bp do sítio de restrição primário e um outro sítio de reco- nhecimento de enzima secundária localizado na seqüência de nucleotídeos que foi ligada (isto é, na segunda seqüência de nucleotídeos).
Preferivelmente, a etapa de digestão da enzima de restrição secundária é realizada por mais que 1 hora por to- da a noite e seguida por inativação a quente da enzima.
Preferivelmente, o DNA nesta mistura da reação é purificado usando métodos/estojos convencionais que são co- nhecidos na tecnologia.
Após a etapa de digestão de enzima de restrição secundária, um sítio de enzima de restrição secundária será localizado a mais que 350-400 bp do sítio de restrição pri- mário na primeira seqüência de nucleotídeos (visada), e um outro sítio de enzima de restrição secundária será localiza- do na seqüência de nucleotídeos ligada (isto é, a segunda seqüência de nucleotídeos). Uma vez que as extremidades da Ρ V ΓΖ Ο 1 Γ U S Ο q U C Γ1C Ζ U U G ri^C-LÍjOu-LClOOO \ v J. SdLla I O t J cj ^it^put^IlOlci de nucleczidecs ligada oêm extremidades ccmpariveis, as se- quências podem ser ligadas a fim de circulari zar o DNA. A etapa de digestão é então seguida por ligação em d ” ^ S d ” ^ ' d Π —· S "T'' d ^ v“cj '’ώ'ν' ' c; y- ^ v- ~ o c r r c u 1 a r i z a ç a o oo p^r das exti ernidaces compatí- veis .
Preferivelmente, a reação da ligação é realizada em uma concentração de DNA de cerca de 1-5 ng/pL.
Preferivelmente, a reação da ligação é realizada por mais que 1 hora (por exemplo, 2, 3, 4 ou mais horas) a cerca de 16-25 °C.
Desta maneira, após a reação da ligação, DNA cir- cularizado pode ser preparado. 0 DNA circularizado compreen- derá os sítios de reconhecimento pelo menos para a enzima de restrição secundária, ou as enzimas de restrição primárias e as secundárias. Em DNA circularizado contendo a primeira se- qüência de nucleotideos (visada), a sitio de reconhecimento da enzima de restrição primária e os sitios reconhecimento de enzima de restrição secundária definirão as extremidades da primeira sequência de nucleotideos (visada) e a seqüência de nucleotideos ligada (isto é, a segunda seqüência de nu- cleotideos;. Desta maneira a primeira seqüência de nucieoti- deos (visada) e a seqüência de nucleotideos ligada são sepa- radas (por exemplo, divididas) pelo sitio de reconhecimento da enzima de restrição primária e o sitio de reconhecimento de enzima de restrição secundária.
Amplificação Uma ou mais reações de amplificação podem ser rea- lizadas a fim de amplificar os padrões 4C de DNA.
Amplificação de DNA pode ser realizada usando inú- meros métodos diferentes que são conhecidos na tecnologia.
Por exemplo, DNA pode ser amplificado usando a reação em ca- deia da polimerase (Saiki et al., 1988); PCR mediada por li- gação, amplificação da replicase Qb (Cahill., Foster and Ma- lian, 1991; Chetverin and Spirin, 1995; Katanaev, Kurnasov and Spirin, 1995); a reação da cadeia ligase (LCR) (Lande- gren et al., 1988; Barany, 1991); o sistema de replicação de seqüência auto-sustentado. (Fahy, Kwoh e Gingeras, 1991) e amplificação de deslocamento de fita (Walker et al., 1992).
Preferivelmente, DNA é amplificado usando PCR. "P- CR" refere-se ao método de K, B. Mullis, patentes U.S. 4.683.195, 4.683.202 e 4.65.188, que descrevem um método pa- ra aumentar a concentração de um segmento de uma seqüência de nucleotideos em uma mistura de DNA genômico sem clonagem ou purificação.
Em uma modalidade, é usado PCR inverso. PCR inver- so (IPCR) (descrito por Ochman et al. (1988) Genetics 120(3), 621-3) é um método para a amplificação rápida in vi- tro de seqüências de DNA que flanqueiam uma região de se- qüência conhecida. O método usa a reação da cadeia polimera- se (PCR), mas ele tem os iniciadores orientados na direção contrária à orientação usual. O padrão para os iniciadores reversos é um fragmento de restrição que foi ligado sobre si próprio para formar um circulo. PCR inverso tem muitas apli- cações em genética molecular, por exemplo, a amplificação e identificação de elementos reversíveis para flanquear se- qüenciadores. Para aumentar a eficiência e reprodutibilidade da amplificação, prefere-se que os círculos de DNA sejam li- nearizados antes da amplificação usando uma enzima de res- trição terciária. Preferivelmente, é usada uma enzima de restrição terciária que é um cortador 6 bp ou mais. Preferi- velmente, a enzima de restrição terciária corta a primeira (visada) seqüência de nucleotídeos entre o sítio da enzima de restrição primária e secundária. A digestão do padrão 3C com a enzima de restrição secundária, circularização opcional, ligação (por exemplo, ligação em condições diluídas) e linearização opcional de primeira seqüência de nucleotídeos (visada) contendo círcu- los produz um padrão de DNA para amplificação ("padrão 4C de DNA").
Para a etapa de amplificação, pelo menos dois oli- gonucleotídeos iniciadores são usados, nos quais cada inici- ador hibridiza para uma seqüência de DNA que flanqueia as seqüências de nucleotídeos de interesse. Em uma modalidade preferida, pelo menos dois oligonucleotídeos iniciadores são usados, nos quais cada iniciador hibridiza para a seqüência visada que flanqueia as seqüências de nucleotídeos de inte- resse.
Em uma modalidade, o termo "flanquear" no contexto de hibridização do iniciador significa que pelo menos um i- niciador hibridiza para uma seqüência de DNA adjacente a uma extremidade (por exemplo, a extremidade 5') da seqüência de nucleotídeos de interesse e pelo menos um iniciador hibridi- 7 0 Ό 3 ΐ 3 :JT.d S td t J ϋ 0 Γ: C ü. d u-. ^ r\ ί 1 a i- UUL.iai ca l> L "ü.^üaUc ·.y ^ exemplo, a extremidade 3' 5 da sequência de nucleotideos de interesse. Preferivelmente, pelo menc-s um iniciador direto hibridiza para uma sequência de DNA adjacente a uma extremi- 11Q0CS Q6 1Π C0I05S0 6 C6i0 fTiGFiCS U.Tl d^lJidUOr icVdido diza para uma sequência de DNA nas outras extremidades (por exemplo, a extremidade 3') da seqüència de nucleotideos de interesse.
Em uma modalidade preferida, o termo "flanquear" no contexto de hibridização do iniciador significa que pelo menos um iniciador hibridiza para uma seqüència visada adja- cente a uma extremidade (por exemplo, a extremidade 5') da seqüència de nucleotideos de interesse e pelo menos um ini- ciador hibridiza para uma seqüència visada nas outras extre- midades (por exemplo, a extremidade 3') da seqüència de nu- cleotídeos de interesse. Preferivelmente, pelo menos um ini- ciador direto hibridiza para uma seqüència visada adjacente a uma extremidade (por exemplo, a extremidade 5') da seqüên- cia de nucleotideos de interesse, e pelo menos um iniciador reverso hibridiza para uma seqüència visada nas outras ex- tremidades (por exemplo, a extremidade 3') da sequência de nucleotideos de interesse.
Da maneira aqui usada, o termo "iniciador" refere- se a um oligonuclectídeo, quer de ocorrência natural ccmo em uma digestão de restrição purificada quanto produzido sinte- ticamente, que é capaz de agir como um ponto de iniciação de síntese, quando colocado scb condições em que a síntese de YÍTT: C Γ t. Ο dc ZXZCZZSlZ dG iniClüOür <5 Cv^u.p X crilLCíl i l α L α uílict ü 2. "C 3 de áci Jc ijudcico 0 induzí de 11 s l o e, e piresen^à de η·_ι cieotideos e um agente de indução tai como pclimerase de DNA e em uma temperatura e pH adequados). 0 iniciador é preferi- velmente fita úr. 1 ~a ra '■a ' - i êr.c i a máxima em am.plif i cação, mas cada scr fita o u p) a . séJ ^ ^_L_a j'ap*ar a ^j.^c^cicici a primeiro tratado para separar suas fitas antes usadas para preparar produtos de extensão. Preferivelmente, o iniciador é um oligodeoxiribonucleotideo' 0 iniciador deve ser sufici- entemente grande para iniciar a síntese de produtos de ex- tensão na presença do agente de indução. Os comprimentos e- xatos dos iniciadores dependerão de muitos fatores, incluin- do temperatura, fonte de iniciador e o uso do método.
Adequadamente, os iniciadores terão pelo menos 15, preferivelmente pelo menos 20, por exemplo pelo menos 25, 30 ou 40 nucleotídeos em comprimento. Preferivelmente, os ini- ciadores de amplificação têm de 16 a 30 nucleotídeos em com- primento .
Preferivelmente, os iniciadores são projetados o mais perto possível dos sítios de reconhecimento de enzima de restrição primária e secundária que separam o primeiro (visado) seqüência de nucleotídeos e a segunda seqüência de nucleotídeos. Os iniciadores pedem ser projetados de maneira que eles estejam dentro de cerca de 100 nucleotídeos - tal como cerca de 90, 80, 70, 60, 50, 40, 30, 20, 10, 9, S, 7, 6, 5, 4, 3, 2 ou 1 nucleotídeos) fora do sítio de reconheci- mento de enzima de restrição primária e secundária.
Adequadamente, os iniciadores de amplificação são projetados de maneira tal que suas extremidades 3' fiquem voltadas para fora em direção aos sítios de reconhecimento de enzima de restrição primária e secundária para que a ex- tensão siga imediatamente através dos sítios de restrição para a segunda seqüência de nucleotídeos.
Se o método de amplificação que é usado é PCR in- verso, então prefere-se que as reações de amplificação sejam realizadas a cerca de 100-400 ng de DNA do padrão 4C (por cerca de 50 pL da mistura de reação de PCR) ou outras quan- tidades de DNA para as quais reações PCR em replicata dá re- sultado produtível (ver Figura 1) e inclui um número máximo de eventos de ligação por reação de PCR.
Preferivelmente, a reação de amplificação de PCR inverso é realizada usando o sistema Expand Long Template PCR (Roche), usando tampão 1 de acordo com as instruções do fabricante.
Amostra O termo "amostra" da maneira aqui usada, tem sig- nificado natural. Uma amostra pode ser qualquer entidade fí- sica que compreende DNA que é ou pode ser reticulada. A a- mostra pode ser de material biológico, ou pode ser derivada dele. A amostra pode ser de uma ou mais entidades, ou pode ser derivada delas - tal como uma ou mais células, um ou mais núcleos, ou uma ou mais amostras de tecido. As enti- dades podem ser de qualquer entidade em que DNA - tal como cromatina - está presente, ou podem ser deriváveis delas. A amostra pode ser de uma ou mais células isoladas ou uma ou mais amostras de tecido isoladas, ou um ou mais núcleos iso- lados ou podem ser derivada deles. A amostra pode ser de células vivas e/ou células mortas e/ou lisatos nucleares e/ou cromatina isolada, ou po- de ser derivada deles. A amostra pode ser de sujeito doente e/ou não do- ente, ou pode ser derivada dele. A amostra pode ser de um sujeito que é suspeito de sofrer de uma doença, ou pode ser derivada dele. A amostra pode ser de um sujeito para ser testado com relação à probabilidade de que ele sofrerá de uma doença no futuro, ou pode ser derivada dele. A amostra pode ser de material de paciente viável ou não viável, ou pode ser derivada dele. A fixação de células e tecidos par o uso para pre- parar o padrão 3C é descrito com detalhe em Splinter et at., (2004) Methods Enzymol. 375, 493-507 Marcação Preferivelmente, as seqüências de nucleotideos (por exemplo, padrões de DNA 4C amplificados, iniciadores ou sondas etc.) são marcadas a fim de assistir em suas aplica- ções à jusante - tal como hibridização de arranjo. A titulo de exemplo, os padrões de DNA 4C podem ser marcados usando iniciação aleatória ou tradução por corte.
Uma ampla variedade de marcações (por exemplo, re- portadores) pode ser usada para marcar as seqüências de nu- cleotídeos aqui descritas, particularmente durante a etapa de amplificação. Marcações adequadas incluem agentes radio- ’ r- ”! ί Η ^ ^3 3 33333 — C[ u Í-3l^. ^ χ ulu--1 ^ ο ^ ci ι ι. c ^ új n crcm.cgêr.iccs bem como substratos, cofatores, inibidores, partículas magnéticas e similares. Patentes que preceituam o uso de tais marcações incluem 03-A-38178 37 , TJ3-A-33oO'5.4, US- A-39 39 3 5 0, US-A-3996343, ΠΡ-a-4 9~7 4 -^ , "S-A-4 2" 11 ? e VS- _Z\ _ τ f £ 2 Λ 1 .
Marcações adicionais incluem, mas sem limitações, P-galactosidase, invertase, proteína fluorescente verde, lu- cíferase, cloramfenicol, acetiltransferase, β-glucuronidase, exo-glucanase e glucoamilase. Marcações fluorescentes podem também ser usadas, bem como reagentes fluorescentes especi- ficamente sintetizados com propriedades químicas particula- res. Uma ampla variedade de meios para medir fluorescência é disponível. Por exemplo, algumas marcações fluorescentes a- presentam uma mudança no espectro de excitação ou emissão, algumas apresentam transferência de energia de ressonância onde um reportador fluorescente perde fluorescência, ao pas- so que uma segunda ganha em fluorescência, algumas apresen- tam uma perda (finalização) ou aparência de fluorescência, ao passo que algumas reportam movimentos rotacionais. A fim de obter material suficiente para marcar, amplificações múltiplas podem ser ligadas, em vez de aumen- tar o número de ciclos de amplificação por reação. Alterna- tivamente, nucleotídeos da reação de amplificação (por exem- plo, 30 ciclos de PCR (sem marcação) + 10 ciclos de PCR (mais marcação)) .
Arranjo Em uma modalidade particuiarmente vantajosa, os padrões de DNA 4C que são preparados de acordo com os méto- dos aqui descritos podem ser hibridizados em um arranjo.
Desta maneira, tecnologia de arranjo (por exemplo, microar- ranjo) pode ser usado para identificar seqüências de nucleo- tídeos - tais como fragmentos genômicos - que freqüentemente compartilham um sitio nuclear com uma primeira (visada) se- qüência de nucleotideos.
Arranjos existentes - tal como arranjos de expres- são e genômicos - podem ser usados de acordo com a presente invenção. Entretanto, a presente invenção também procura fornecer arranjos inéditos (por exemplo, arranjos de DNA) como aqui descrito.
Um "arranjo" é uma coleção de ácidos nucléicos in- tencionalmente criada que pode ser preparada tanto sinteti- camente quanto bio-sinteticamente e classificada pela ativi- dade biológica em uma variedade de diferente formatos (por exemplo, bibliotecas de moléculas solúveis; e bibliotecas de oligos presos a contas de resina, chipes de silica, ou ou- tros suportes sólidos). Adicionalmente, o termo "arranjo" inclui as bibliotecas de ácidos nucléicos que podem ser pre- paradas localizando pontos de ácidos nucléicos essencialmen- te de qualquer comprimento (por exemplo, de 1 a cerca de 1.000 monômeros de nucleotideos em comprimento) em um subs- trato .
Tecnologia de arranjo e as várias técnicas e apli- cações associadas com ela estão descritas de maneira geral em inúmeros livros texto e documentos. Isto inclui Lemieux at aL, 1998, Molecular Breeding 4, 277-289 r Schema and Jd / ^ ^ . raiod. ícj. η:ι3ΐ ysi» m ι-ϋ ^ιυιύιίίι,'αι víj-Lpeis . J.n γ^-λ Methcás Mar.ua 1 ,eds. M. Punis, D. Geiíand, J. Sninsky·· , Schena and Davis, 1999, Genes, Genomas artd Chips. In DNA
Mcroarrays: A Fracticai Approach (ed. M. Schena), Oxford iXacure Ge::ezica speciax rssue; w arruar y ouppj.cir.eno. , Mark Schema Microarray Biochip Technology, (Eaton Publishing Company), Comes, 2000, The Scientist 14(17]:25, Gwynne and Page, Mícroarray analysis: the next revolution in molecular biology, Science, 1999 August 6; and Eakins and Chu, 1999, Trends in Biotechnology, 17, 217-218.
Tecnologia de arranjo supera as desvantagens com métodos tradicionais em biologia molecular, que de maneira geral funcionam em uma base "um gene em um experimento", re- sultando em baixa produção e o incapacidade para perceber a "imagem total" da função do gene. Atualmente, as principais aplicações para tecnologia de arranjo incluem a identifica- ção de seqüência (mutação gene/gene) e a determinação de ní- vel de expressão (abundância) de genes. Perfilamento de ex- pressão do gene pode fazer uso de tecnologia de arranjo, op- cionalmente em combinação com técnicas proteômicas (Ceils et ai., 2000, FEBS Lett, 480(1):2—16; Lockhart and Wier, 2000, Nature 405(6788):827-836; Khm et at., 1999, 20(2):223-9).
Outras aplicações de tecnologia de arranjo são também conhe- cidas na tecnologia; por exemplo, descoberta do gene, pes- quisa do câncer (Marx, 2000, Science 289: 1670-1672; Scherf, et aí., 20C0, Nat Genet; 24(3): 236-44; Ross et al., 2000, Nat Genet. 2000 Mar; 24(3): 227-35), análise SNP (Wang et ai., 2 7 22 , 282 2366': 7227-62 , aesecoerza ae rneai- camento, tarmaccqenômicos, diagnóstico de doença (por exem- olo, utilizando dispositivos microfluídiccs: Chemical & En- gineeri.og News, February 22, 1599, 77 3 ; : 27-36 ; , toxicclogy fRocket t and Dix '(fCOC) , Xencbictica, 3 0 ;2) : 151 - 77; Afobara. — i á- ., , ^ar.uer o, e s _; üs , o; : a o o — o o ; e t o x i c o g e n c m i — ccs (um híbrido de genõmiccs funcionais e toxicologia mole- cular) .
De um modo geral, qualquer biblioteca pode ser ar- ranjada de uma maneira ordenada em um arranjo, separando es- pacialmente os elementos da biblioteca. Exemplos de biblio- tecas adequadas para arranjo incluem bibliotecas de ácido nucléico (incluindo bibliotecas de DNA, cDNA, oligonucleotí- deo, etc.), peptídeo, polipeptideo e bibliotecas de proteí- na, bem como bibliotecas que compreendem qualquer molécula, tal como bibliotecas ligantes, entre outras.
As amostras (por exemplo, elementos de uma biblio- teca) são de maneira geral fixadas ou imobilizadas em uma fase sólida, preferivelmente um substrato sólido, para limi- tar difusão e mistura das amostras. Em uma modalidade prefe- rida, bibliotecas de ligantes de ligação de DNA pedem ser preparadas. Em particular, as bibliotecas podem ser imobili- zadas em uma fase sólida substancialmente planar, incluindo membranas e substratos não porosos tais como plástico e vi- dro. Além do mais, as amostras são preferivelmente arranja- das de uma maneira tal que indexação (isto é, referência ou acesso a uma amestra particular) é facilitada. Tipicamente, as amostras são aplicadas como pontos em uma formação de ma- ^ 11 cí . 3^St-c:iV.US 38 ζτ : ι S 8 ^ vj ^í_jLíluIiS pUUtUU S8I udapOUQOS f'OI"P. 0 S U e propósito. Por exemplo, um arranjo pode ser imobiii zado na superfície de uma micrcpiaca, tanto ccm múltiplas amestras em um peço, quanto ccm uma única amestra em cada peço. Além ppg·> ç 7 substrato sólido pode ser ume. membrana, taus como ■um nitrocelalose ou membrana de náiion ipor exemplo, membra- nas usadas em experimentos tipo blet). Substratos alternati- vos incluem vidro, ou substratos a base de sílica. Assim, as amostras são imobilizadas por qualquer método adequado co- nhecido na tecnologia, por exemplo, por interações de carga, ou por acoplamento químico nas paredes ou base dos poços, ou o superfície da membrana. Outros meios de arranjar e fixar podem ser usados, por exemplo, pipetação, gota e toque, dis- positivo piezoelétrico, tecnologia de jato de tinta e jato de bolha, aplicação eletrostática, etc. No caso de chipes a base de silicone, fotolitografia pode ser utilizada para ar- ranjar e fixar as amostras no chipe.
As amostras podem ser arranjadas "localizadas" no substrato sólido; isto pode ser feito à mão ou fazendo uso de robótica para depositar a amostra. De um modo geral, ar- ranjos podem ser descritos como macroarranjos ou microarran- jos, a diferença sendo o tamanho dos pontos de amostra. Ma- croarranios tipicamente contêm tamanhos da localização pon- tual da amostra de cerca de 300 microns ou mais e podem ser facilmente imageados por dispositivos de varredura de gel e blot existentes. Os tamanhos da localização pontual da amos- tra em microarranjos são tipicamente menos que 200 microns de diâmetro e estes arranjes frequentemente contêm milhares ccr.LCs „ a?si m, microarrar^os coderr reauere r rr.rrcr.ica e pQ-i-íp^TYi0pi+-o do "ϊ tTl 3 Q 0 â ΓΠ θ η O 0ST00C131 17·”. fÍ0S f QU0 Ό O Cí Θ ΓΠ ΌΓΘΟΙ "" sar ser feitos sob medida. Instrumentação é descrita de ma- neira geral em uir.a revisão por Cortese, 2000, The Scientist ^ Vt ^ J ·ί_0. Técnicas para produzir oioiioiecas imooiιιzaaas de moléculas de DNA foram descritas na tecnologia. De maneira geral, métodos da tecnologia mais antiga descreveram como sintetizar bibliotecas de molécula de ácido nucléico de fita única, usando, por exemplo, técnicas de mascaramento para construir várias mutações de seqüências nas várias posições discretas no substrato sólido. Patente U.S. 5.837.832 des- creve um método melhorado para produzir arranjos de DNA imo- bilizados com substratos de silicone com base na tecnologia de integração em escala muito grande. Em particular, Patente U.S. 5.837.832 descreve uma estratégia denominada "azuleja- mento" para sintetizar conjuntos específicos de sondas em locais espacialmente definidos em um substrato que pode ser usado para produzir as bibliotecas de DNA imobilizadas da presente invenção. A patente U.S. 5837832 também fornece re- ferências para técnicas anteriores que podem também ser usa- das .
Arranjos podem também ser construídos usando quí- mica de fotodeposíção.
Arranjos de peptídecs (ou peptidomiméticos) podem também ser sintetizados em uma superfície de uma maneira que coloca cada elemento da biblioteca distinto (por exemplo, seqüência de peptídeo única) em uma localização discreta, Ulé-Uc7_iii-L<Jel dX-Lali u. η i iJc[:^_Udüe ΟΘ Cd 03 θ 1 ΘΓΓΘΠ C 03 biblioteca é determinada por sua localização espacial no ar- ranjo. Os locais no arranje onde interações de ligação entre uma molécula pré-determinada (per exemplo, uma visada ou sendo; e elementos da biblioteca reatives ocorrem é detormi aauo, nenm i icavc assim as seguencias nos elementos cia bi- blioteca reatives na base de localização espacial. Estes mé- todos são descrito em Patente U.S. 5.143.854; W090115070 e W092110092; Fodor et at. (1991) Science, 251: 767; Dower and Fodor (1991) Ann. Rep.Med. Chem., 26: 271, Para ajudar a detecção, marcações são tipicamente usadas (da maneira supradiscutida} - tal como qualquer re- portador facilmente detectável, por exemplo, um reportador fluorescente, bioluminescente, fosforescente, radioativo, etc. Tais reportadores, sua detecção, acoplamento em al- vos/sondas, etc. são discutidos em outro lugar neste docu- mento. Marcação de sondas e alvos é também revelada em Sha- lon et ai., 1996, Genoma Res 6(7):639-45.
Exemplos específicos de arranjos de DNA são como a seguir: Formato I: sonda cDNA (500 ~ 5.000 bases de com- primento) é imobilizada em uma superfície sólida tal como vidro usando localização por robô e exposta a um conjunto de alvos tanto separadamente quanto em uma mistura. Este método é amplamente considerado tendo sido desenvolvido na Stanford University (Ekins and Chu,1999, Trends in Biotechnolcgy, 1999, 17, 217-218).
Formato II: um arranjo de oligonucieot1deos (20- 2 5-iítói. uiiiiüS, ui e fer i v e Imen t e , 40-6C mei uiiqus i ou dCJüu nuclérco de oeotideo ; ?NA: as sondas são sintetizadas tanto in si tu {em-chipe} quanto por síntese convencional seguido per írr.obilízação em-chipe. 0 arranjo é exposto no DNA da a- ~ 'stra ~ur rede, rinridrrndc, e a idontrdnde, abundância, uc seqüências complementares são determinadas. Cnipe de ONA co- mo este e vendado oe^e j.nf Lj-meL.rrx, In^. , ^cd u marca regis trada GeneChip®. Agilent e Nimblegen também fornecem arran- jos adequados (por exemplo, arranjos de azulejamento genômi- co) .
Exemplos de alguns formatos de microarranjo comer- cialmente disponíveis são apresentados na Tabela 1 a seguir (ver também Marshall e Hodgson, 1998, Nature Biotechnology, 16(1), 27-31).
Tabela 1: Exemplos de formatos de microarran]os de híbrídização atualmente disponíveis A fim de gerar dados de ensaios baseados em arran- jo, é detectado um sinal que significa a presença de ou au- sência de híbrídização entre uma sonda e uma seqüência de nucleotídeos. A presente invenção contempla adicionalmente técnicas de marcação direta e indireta. Por exemplo, marca- ção direta incorpora corantes fluorescentes diretamente nas seqüências de nucleotídeos que hibridizam para o arranjo as- sociado a sondas (por exemplo, corantes são incorporados na seqüência de nucleotídeos por síntese enzímática na presença de nucleotídeos ou iniciadores de PCR marcados). Esquemas de marcação direta produzem sinais de híbrídização fortes, ti- picamente usando famílias de corantes fluorescentes com es- truturas químicas e características similares, e são simples de implementar. Em modalidades preferidas que compreendem marcação direta de ácidos nucléicos, cianina ou análogos a- lexa são utilizados em análise de arranjo comparativo de multi-flúor. Em cutras modalidades, esquemas de marcação in- direta podem ser utilizados para incorporar epítcpos ncs á- cidos nucléicos, tanto antes de quanto após a híbrídização para as sondas de microarranjo. Um ou mais manchamentos, procedimentos e reagentes são usados para marcar o complexo hibridizado (por exemplo, uma molécula fluorescente que liga aos epítopos, fornecendo assim um sinal fluorescente em vir- tude da conjugação de molécula do corante com o epitopo da espécie hibridizada).
Análise de dados é também uma importante parte de um experimento envolvendo arranjos. Os dados brutos de um experimento do arranjo tipicamente são imagens, que precisam ser transformadas em matrizes - tabelas, onde fileiras re- presentam, por exemplo, genes, colunas representam, por e- xemplo, várias amostras tais como tecidos ou condições expe- rimentais, e números em cada célula, por exemplo, caracteri- zam a expressão de uma seqüência particular (preferivelmen- te, uma segunda seqüência que foi ligada com a primeira (vi- sada) seqüência de nucleotideos) na amostra particular. Es- tas matrizes têm de ser analisadas ainda mais, se qualquer conhecimento a cerca dos processos biológicos subjacente ti- ver que ser extraído. Métodos de análise de dados (incluindo análise de dados supervisionada e não supervisionada bem co- mo abordagens bioinformáticas) são revelados em Brazma and Vilo J (2000) FEES Lett 480(1): 17-24.
Na forma aqui descrita, uma ou mais seqüências de nucleotideos (por exemplo, o padrão de DNA) que são marcadas e subsequentemente hibridizadas para um arranjo compreendem uma seqüência de nucleotideos que é enriquecida por pequenos trechos de seqüências com uma assinatura distinta, isto é, cobrindo a seqüência de nucleotideos entre o sítio de reco- nhecimento da enzima de restrição primária que foi ligada durante o procedimento 3C com a primeira (visada) seqüência qüênc i a c(p nur I eorideos, e seu respect i νυ siuu iie lecuiiiie- 0 rr 0 ^ r 0 s 0 e ^ z " ^ a si 0 ir 0 s ^ ^ ç 3 o s e u 0 q 3 Ϊ* i 3 vizírro.
Um arranje simples pode compreender múltiplas (per exemplo, duas ou mais) seqüências baios.
c íi-J-ci S
Da maneira aqui usada, o termo "sonda" refere-se a uma molécula (por exemplo, um oligonucleotideo, quer de c·- corrência natural como em uma digestão de restrição purifi- cada quer produzido sinteticamente, recombinantemente ou por amplificação de PCR), que é capaz de hibridizar com uma ou- tra molécula de interesse (por exemplo, um outro oligonucle- otideo) . Quando as sondas são oligonucleotídeos, elas podem ser fita única ou fita dupla. As sondas são usadas na detec- ção, identificação e isolamento de alvos particulares (por exemplo, seqüências de gene). Aqui descrito, contempla-se que sondas usadas na presente invenção podem ser marcadas com uma marcação para que seja detectável em qualquer siste- ma de detecção, incluindo, mas sem limitações, sistemas de enzima (por exemplo, ELISA, bem como enzima com base em en- saios histoquimicos), fluorescente, radioativo, e lumines- cente. Com relação a arranjos e microarranjcs, o termo "son- da" é usado para referir-se a qualquer material níbridizável que é afixado ccm o arranjo com o propósito de detectar uma seqüência de nucleotídeos que foi hibridizado com a dita sonda. Preferivelmente, estas sondas têm 25-60 mers cu mais.
Estratégias para desenho de sonda são descritas em W095/11995, EP 717,113 e W097129212.
Uma vez que 4C permite uma pesquisa de genoma não ■Oro,'-)' qp^c>-.a ^mr; ' 3 ' ■' - >" ·. ' ······· ; P T T 3 O ~ 1 ; O S Ο Ç T 0 p S Γ R *" U T: arranjo com scr.das interrogando cada sítio de reconhecimento da enzima de restrição primária nc genoma possível í,por e- xemplo, único/não repetitivo'. A&aiíli, de senil o do aüaíÇu Buii-feiilc aepéiiJc Cia csüu- j_ha de enzima de restrição primaria e não das sequências de nucieotídeos primária ou secundária atual.
Embora arranjos existentes possam ser usados de acordo com a presente invenção, prefere-se usar configura- ções alternativas.
Em uma configuração, uma ou mais sondas no arranjo são projetadas de maneira que elas possam hibridizar perto dos sítios que são digeridos pela enzima de restrição primá- ria. Mais preferivelmente, a(s) sonda(s) é(sâo) em cerca de 20 bp do sítio de reconhecimento de enzima de restrição pri- mária. Mais preferivelmente, a(s) sonda (s) é(são) em cerca de 50 bp do sítio de reconhecimento de enzima de restrição primária.
Adequadamente, a(s) sonda(s) é(são) dentro de cer- ca de 100 bp (por exemplo, cerca de 0-100 bp, cerca de 20.400 bp) do sítio de reconhecimento de enzima de restrição primária.
Em uma configuração preferida, uma sonda simples, única, é projetada em 100 bp a cada lado dos sítios que sao digeridos pela enzima de restrição primária.
Em uma outra configuração preferida, as posições os sítios digerido pela enzima de restrição secundária com relação às posições dos sítios digeridos pelos sítios de rp?r Y-l fyr - rr-^y- 3 0 « o-< 17 7· τ' C; - ~j0 Γ ■= Ç 5 C . SaS - ?. 7 Ο Γ. t '. ~ guração, uma sonda simples, única, é projetada somente a ca- da lado dos sities digeridos pe^a enzima de restrição prima- ria que têm o sitio de reconhecimento de enzima de restrição Secundária Uertu d uma Clxs tdliCXd JOdStdílLe grande pUÍ ullid sor.aa ae um dado comprimento a ser projetada entre c sitie de reconhecimento de enzima de restrição primária e secundá- ria. Nesta configuração, por exemplo, nenhuma sonda é proje- tada ao lado de um sítio de reconhecimento da enzima de res- trição primária particular que tem um sitio de reconhecimen- to da enzima de restrição secundária dentro de 10 bp desse mesmo lado.
Em uma outra configuração, as sondas no arranjo são projetadas de maneira que elas possam hibridizar em am- bos os lados dos sítios que são digeridos pela enzima de restrição primária. Adequadamente, uma sonda simples a cada lado do sitio de reconhecimento da enzima de restrição pri- mária pode ser usada.
Ainda em uma outra configuração, duas ou mais son- das (por exemplo, 3, 4, 5, 6, 7 ou 8 ou mais) podem ser pro- jetadas a cada lado do sitio de reconhecimento de enzima de restrição primária, que podem em seguida ser usadas para in- vestigar o mesmo evento de ligação. Para o número e posição de sondas com relação a cada sitio de reconhecimento de en- zima de restrição primária, a localização genômica exata de seu sitio de reconhecimento de enzima de restrição secundá- ria vizinho pede ser levada em consideração.
Ainda em uma outra configuração, duas ou mais son- uas :uu l excn.pl o, o, 4, d, c, 7 ou * ou ma i s: poce pro- 1 etadas oróximo a cada sítio de rscothtci mento da er.z ioa ds restrição primária independente do sítio de reconhecimento de enzima de restrição secundária mais próxima. Nesta confi- guração , todas ccnaas devem estar perto oes Sx v^s oe reco- nhecimento da enzima de restrição primaria íprererive Imente dentro de 300 bp do sítio de restrição).
Vantajosamente, o último desenho e também o dese- nho que usa 1 sonda por (lado) sítio de reconhecimento de enzima de restrição primária, permite o uso de diferentes enzimas de restrição secundária em combinação com uma dada enzima de restrição primária.
Vantajosamente, o uso de múltiplas (por exemplo, 2, 3, 4, 5, 6, 7 ou 8 ou mais) sondas por sítio de reconhe- cimento da enzima de restrição primária pode minimizar o problema de obter resultados negativos falsos por causa do fraco desempenho de sondas individuais. Além do mais, pode também aumentar a confiabilidade de dados obtidos com um ex- perimento chipe simples e reduzir o número de arranjos re- queridos para tirar conclusões estatisticamente sólidas.
As sondas para o uso no arranjo podem ser maiores que 40 nucleotídeos em comprimento e podem ser ísotérmicas.
Preferivelmente, sondas contendo seqüências de DNA repetitiva sãc excluídas.
Supõe-se que diagnóstico de sondas para os sítios de restrição que flanqueiam diretamente cu que estão próxi- mas da primeira seqüência de nucleotídeos dêem sinais de hi- bridização muito fortes e podem também ser excluídas do de- QPnhr-- Η. -1 =:.-- y ,ã p 0 arranj 3 peje tratai qualquer gencir.a incluindo mamífero fper exemple, humano, canundcr.go ipor exemplo, cre- mos somo 7) } , vertebrado {por exemplo, zebrafish;;, cu não o 1 ^ v-. q· A -! ^ q: v ^ ~ r*· “ ~ Em uma modalidade preferida adicional, o arranjo contém 2-6 sondas em torno de cada sitio de restrição primá- ria único e o mais próximo possível do sítio de digestão de enzima de restrição.
Preferivelmente, a distância máxima do sítio de digestão de enzima de restrição é cerca de 300 bp.
Em um modalidade preferida adicional da presente invenção, são fornecidos arranjos para enzimas de restrição - tal como HindIII, EcoRI, BglII e Notl - que tratam os ge- nomas mamífero ou não mamífero. Vantajosamente, o desenho dos arranjos aqui descritos evita a necessidade de redese- nhar arranjos para cada seqüência visada, análise fornecida é realizada na mesma espécie.
Conjuntos de sondas Da maneira aqui usada, o termo "conjunto de son- das" refere-se a uma suíte cu uma coleção de sondas que hi~ bridiza para cada um des sítios de reconhecimento da enzima de restrição primária para uma enzima de restrição primária em um ger.cma.
Desta maneira, é fornecido, em um aspecto adicio- nal, um conjunto de sondas complementares em seqüência à se- qüência de ácido nuciéico adjacente a cada uma des sities de T d ,*’ ^ -ρ, V“i ζζ, γ· ~ rr. ο Τ' +■ γ\ ,Ηλ ω -η τ ί τη m Ηλ ύ~ <τί ο ~ ν- -ϊ -· --5 ·-· ρ Τ’ -Í 2Γ Í ρ. ^ ^ ^ '3 Γ3 3 C '"ι zima de restrição primária r.c DNA ger.cmicc.
Adequaaamer.re, o ccnjur.to das sondas é ccmpiemen- tar em seqüêr.cia aos primeiros 25-cC (por exemplo, 35-60, 4 5 — 6 C 3 5 C — 6 C 3 '3 ΓΓ. 3 3 S Γ 3 C 1 3 o í i t: C S 31 ■-3 q = ρ. η η ' n -- ,ί~ - ko q = •rada um des sities de roccnhccirr.cntc da enzima de restrição primária no DNA gencmico. 0 conjunto de sendas pede ser com- plementar em seqüência ccm um lado (por exemplo, qualquer) ou ambos os lados do sitio de reconhecimento de enzima de restrição primária. Desta maneira, as sondas podem ser com- plementares em seqüência à seqüência de ácido nucléico adja- cente a cada lado de cada um dos sitios de reconhecimento da enzima de restrição primária no DNA genômico. É também possível definir uma janela (por exemplo, 300 bp ou menos - tal como 250 bp, 200 bp,150 bp ou 100 bp - do sítio de reconhecimento de enzima de restrição primária) em que uma ou mais sondas para o conjunto podem ser projeta- das. Tais fatores que são importantes na definição da janela na qual redesenha as sondas são, por exemplo, teor de GC, ausência de seqüências palindrômicas que podem formar estru- turas do grampo, tamanho máximo para distâncias de um tipo de nucleotídeo simples. Desta maneira, o conjunto de sondas pode ser complementar em seqüência à seqüência de ácido nu- cléico que está menos que 300 bp de cada um dos sítios de reconhecimento da enzima de restrição primária no DNA genô- mico. É também possível definir uma janela de cerca de ICO bp dc sítio de reconhecimento da enzima de restrição primária a fim de identificar scndas ideais próximas a cada sitio de restrição.
ElTi TCvO - 1 0.3. QS S dCllCIGr.cIS C*â p Γ Θ S 0 Π16 _L Γ; V0 Π Ç ci c 7 o conjunto das scndas é complementar à seqüência que está me- nos que 30C bc de cada um dos sítios de reconhecimento de enzima de restrição primária no DNA genômico , complementares à seqüência que é entre 200 e 300 bp de cada um des sities de reconhecimento da enzima de restrição primária no DNA ge- nômico e/ou complementares à seqüência que está entre 100 e 200 bp de cada um dos sítios de reconhecimento da enzima de restrição primária no DNA genômico.
Em modalidades adicionais da presente invenção, o conjunto das sondas é complementar à seqüência que é de 0 a 300 bp de cada um dos sítios de reconhecimento da enzima de restrição primária no DNA genômico, complementar à seqüência que está entre 0 a 200 bp de cada um dos sítios de reconhe- cimento da enzima de restrição primária no DNA genômico e/ou complementar à seqüência que está entre 0 a 100 bp de cada um dos sítios de reconhecimento da enzima de restrição pri- mária em DNA genômico (por exemple, cerca de 10, 20, 30, 40, 50, 60, 70, 80 ou 90 bp de cada um dos sítios de reconheci- mento da enzima de restrição primária r.c DNA genômico) .
Duas ou mais sondas pode ainda ser projetadas que são capazes de hibridizar para a sequência adjacente a cada sitie de reconhecimento da enzima de restrição primária no DNA genômico.
As scndas pedem sebrepor-se, ou sebrepeem-se par- ciaimente. 3e as sondas ficarem sobrepostas, então a sobre- y~\ > c ί ■ 3 r^· rS ν-· r f Γ. ν’ ι 'ό, 1 Γ·ι"ΐη ·-,γ'. rr η·. ■”> c .—^ 1J. ^ Ο CÍ C· - Pedem rambém ser usados fragmentos de FCR repre- 5ΘΓ. wãr.dc C G 2Γ z ΓΓι Θ X JGG — — ó z z Π-JC ucC - u Clcus ■_ w ■—■■ 1Γ cXc ΓΤϊ]0 z ^ , — — '■- , 1-4 C, 1-60, 1-80, 1-100, 1-120, 1-140, 1-16C, 1-180,1-200, rada sitio dc reconhecimento da enzima de restrição primá- ria.
Fragmentos de PCR podem também ser usados como sondas que correspondem exatamente a cada sitio genômico que é flanqueado pelo sitio de reconhecimento da enzima de res- trição primária e o primeiro sitio de reconhecimento de en- zima de restrição vizinho ao segundo. Desta maneira, a se- qüência de sondas pode corresponder a toda ou parte da se- quência entre cada um dos sítios de reconhecimento da enzima de restrição primária e cada um dos sítios de reconhecimento de enzima de restrição primários vizinhos do secundário.
Tipicamente, as sondas, arranjos de sondas ou con- juntos de sondas serão imobilizados em um suporte. Suportes (por exemplo, suportes sólido,) podem ser feitos de uma vari- edade de materiais - tais como vidro, sílica, plástico, nái- lon ou nitrocelulose. Suportes são preferivelmente rígidos e têm uma superfície plana. Suportes tipicamente têm de cerca de 1-10.000.000 regiões espacialrr.ente endereçáveis discre- tas, ou células. Suportes tendo cerca de 10-1.000.000 ou cerca de 100-100.000 cu cerca de 1C0C-1G0.C00 células sãc comuns. A densidade de células é tipicamente pelo mer.os cer- ca de 1.000, 10.000, 100.000 ou 1.000.000 células dentro de um centímetro quadrado. Em alguns suportes, tcdas as células são ocupadas por misturas agrupadas de sondas ou um conjunto de sondas. Em outros suportes, algumas células são ocupadas por misturas agrupadas de sondas ou um conjunto de sondas, e outras células são ocupadas pelo menos até o grau de pureza obtenível pelos métodos da síntese, por um tipo simples de oligonucleotídeo.
Preferivelmente, o arranjo aqui descrito compreen- de mais que uma sonda por sítio de reconhecimento de enzima de restrição primária, que, no caso de uma enzima de restri- ção de corte 6 bp, ocorre, por exemplo, aproximadamente 750.000 vezes por genoma humano ou camundongo.
Para uma enzima de restrição que reconhece uma se- qüência de reconhecimento >6 bp, um arranjo simples de cerca de 2 x 750.000 sondas pode ser usado para cobrir, por exem- plo, o genoma humano ou camundongo completo, com 1 sonda a cada lado de cada sítio de restrição.
Em um desenho de arranjo preferido, o número total de moléculas de sonda de uma dada seqüência de nucleotídeos presente no arranjo é em grande excesso em relação a frag- mentos homólogos presentes na amostra 4C a ser hibridizada com tal arranjo. Dada a natureza de tecnologia 4C, fragmen- tos representando regiões genômicas perto da seqüência de nucleotídeos analisada no padrão de cromatina linear será em grande excesso na amostra de hibridização 4C (como descrito na Figura 2). Para obter informação quantitativa a cerca de eficiência de hibridização de tais fragmentos abundantes, pode ser necessário reduzir a quantidade de amostra a ser hibridizada e/ou aumentar o número de moléculas de uma dada H .q Η ^ q^rr ;Λγ ^τ_ γ, Ηρ. q ] τ_ g ^ C ^_ '°' C *1 ’ CÍ C 3 3 Π Ο 3 κ 3 3. 3 ” Ο * ASSim, p α U â d Ο Θ Ο 8 C Ç ã Ο de 8 1 8 ΓΓ. 6 Γ. t C S ISÇUiSdorSS de DoA que fazem contato frequentemente, por exemplo, um ele- mento promotor de gene, pode ser necessário usar um arranjo nem sondas eme rscresenoa somerce a regiã-· gerem:--a se’ ec- -- nada (per exemplo, cerca de C, 54C Mc; , mas com cada sonda única presente em múltiplas posições no arranje (por exem- plo, cerca de 100, 200, 1000) . Tais desenhos podem também ser preferidos com o propósito de diagnóstico para detectar local (por exemplo, em cerca de 10 Mb) ré-arranjes genômicos - tal como deleções, inversões, duplicações, etc. - em torno um sítio (por exemplo, gene de interesse). O arranjo pode compreender cerca de 3 x 750.000 sondas, 4 x 750.000 sondas, 5 x 750.000 sondas ou, preferi- velmente, 6 x 750.000 sondas. Mais preferivelmente, o arran- jo compreende 6 x 750.000 sondas com 2, 3, 4, 5, 6, 7 ou 8 ou mais sondas a cada lado de cada sítio de restrição. Mais preferivelmente, o arranjo compreende 6 x 750.000 sondas, com 3 sondas em cada lado de cada sítio de restrição.
Arranjos de sondas ou conjuntos de sondas podem ser sintetizados etapa per etapa em um suporte, ou pedem ser anexados de ferma pré-sintetizada. Um método de síntese VL- SI PS. TM. (comc descrito em US 5.143.854 e EP 476.C14), que exige o uso de luz para direcionar a síntese de sondas de oiigcnuclectideo em arranjos miniaturizades de alta densida- de. Algoritmos para desenho de máscaras para reduzir o núme- ro de ciclos de síntese são descritos em US 5.571.639 e US. 5.593.839. Arranjos podem também ser sintetizados de um m.cdc combinatório, distribuindo monômeros às células de um supor- te por caminhos de fluxo mecanicamente restritos, descritos em EP 624.059. Arranjos podem também ser sintetizados por reagentes de localização em um suporte usando uma impressora jato de tinta (ver, por exemplo, EP 728.520).
No contexto da presente invenção, os termos "subs- tancialmente um conjunto de sondas" "substancialmente o ar- ranjo de sondas" significa que o conjunto ou o arranjo de sondas compreende pelo menos cerca de 50, 60, 70, 80, 90, 95, 96, 97, 98 ou 99 % do conjunto ou arranjo de sondas to- tal ou completo. Preferivelmente, o conjunto ou o arranjo de sondas é um conjunto de sondas total ou completo (isto é, 100 %).
Em uma modalidade preferida, o arranjo compreende uma sonda simples única por lado de cada sitio de reconheci- mento enzima de restrição primária que é presente em um dado genoma. Se este número de sondas exceder o número de sondas que pode ser contido por um arranjo simples, o arranjo pode preferivelmente ainda conter uma representação do genoma completo de uma dada espécie, mas em baixa resolução, com por exemplo uma a cada 2, 3, 4, 5, 6, 7, 8, 9, 10, ΙΟ2, 103 ou 104 etc. sondas ordenadas no padrão do cromossomo linear presente no arranjo. Tais arranjos que tratam o genoma huma- no completo, ou outros, em resolução subideal podem ser pre- feridos com relação a arranjos de alta resolução que tratam parte do mesmo genoma, por exemplo, em casos onde devem ser encontrados parceiros translocação.
Preferivelmente, a representação do genoma comple- to de uma dada espécie em baixa resolução é obtida por son- das no arranjo em que cada uma representa um fragmento de restrição simples obtido após digestão com uma enzima de restrição primária. Preferivelmente, isto é obtido ignorando cada segunda, terceira, quarta, quinta, sexta, sétima, oita- va, nona, décima, vigésima, trigésima, quadragésima, quin- quagésima, sexagésima, septuagésima, octagésima, nonagésima ou centésima, etc. sonda que hibridiza para o mesmo fragmen- to de restrição.
Preferivelmente, a representação do genoma comple- to de uma dada espécie em baixa resolução compreende sondas que são distribuídas igualmente juntamente com os padrões do cromossomo lineares. Preferivelmente, isto é obtido ignoran- do uma ou mais sondas nas regiões genômicas que apresentam densidade alta de sonda.
Hibridização 0 termo "hibridização" da maneira aqui usada in- cluirá "o processo pelo qual uma fita de ácido nucléico une- se a uma fita complementar por meio de pareamento de base" bem como o processo de amplificação realizado por exemplo, em tecnologias de reação da cadeia de polimerase (PCR).
Seqüências de nucleotídeos capazes de hibridização seletiva serão feitas de maneira geral pelo menos-75 %, pre- ferivelmente pelo menos 85 ou 90 % e mais preferivelmente pelo menos 95 % ou 98 % homólogo a seqüência de nucleotídeos complementar correspondente em uma região de pelo menos 20, preferivelmente pelo menos 25 ou 30, por exemplo, pelo menos 40, 60 ou 100 ou mais nucleotídeos contíguos. '(! 1- -1 ' -- - . ~ .’ Γ ■ τι -Π · ~ ιΐ^υί^αϋανα^ capcLiiiLa itiiCic-je d i ujd^da, vju- p.exaçâc, cu hibndizaçáo de una rr.ciécu La somente com uma sequência de r.uclectídeos particular scb condições rigorosas ípcr exemplo, 65 °C e 0,1 x SSC {1 x SSC - NaCl 0,15 M, Na- ~it rat ? ',015 '1 pH “, 0 ;·: . Condições rigorosas sãt condições α·= '4^0x5 xi..a süuUq íuOíiiUtaia com sua sequencia visada, mas ccm nenhumas outras sequências. Condições rigorosas de- pendem da seqüência, e são diferentes em circunstâncias di- ferentes. Seqüências maiores hibridizam especificamente em altas temperaturas. De maneira geral, condições rigorosas são selecionadas para ser cerca de 5 °C menor que os pontos de fusão (Tm) para a seqüência especifica em um comprimento e pH iônicos definidos. A Tm é a temperatura (sob intensida- de iônícas, pH, e concentração de ácido nucléico definidos) em que 50 % das sondas complementares em uma seqüência visa- da hibridizam para a seqüência visada em equilíbrio. (Como as seqüências visadas estão de maneira geral presentes em excesso, a Tm, 50 % das sondas são ocupadas em equilíbrio) .
Tipicamente, condições rigorosas incluem uma concentração de sal de pelo mencs cerca de 0,01 a 1,0 M de concentração iô- nica Na íou outros sais) a pH 7,0 a 8,3 e a temperatura é pelo menos cerca de 30 °C para sondas pequenas. Condições rigorosas pedem também ser alcançadas ccm a adição de agen- tes desestabil i zantes - tais como formamida ou sais de te- tralquiia amcnic.
Come é de conhecimento des versados na técnica, uma hibridização de máxima severidade pode ser usada para identificar cu detectar seqüências de nuclectídecs idênticas ι— ^ Ζ-ΓΓιΖ ΓΊ u_ t) H _l d Z x ci ^ α G _l Pi u £ αΓΓΓιΘ Cl Z α 1 Z ca ScV6i" α i, OU >Z õ. Z ' xa) pode ser usada para identificar ou detectar sequências de polinucleotídeos similares cu relacionadas. ca o também descritos metcdos para a hibrídizaçao de d. 0 sordís ^οιίπ s θο'Ίθ^ ^ 1 ·Ξ ct^1 ^1" c ^^ ^ 1 de o ^ ^ v ^ _ -.^cí o CJ. ± +3.·^ ma. Γ dâuüS > idS u_- o IZ d ^ Z :5 vJ.0 Z Z Z Ç a. G ΰθ Γϊ x JO L ± Q j_ Z ci p ci c particulares podem ser controladas para alterar a hibridiza- ção (por exemplo, aumentar ou diminuir a severidade de liga- ção da sonda/alvo). Por exemplo, temperatura da reação, con- centrações de ânions e cátions, adição de detergentes, e si- milares podem todos alterar as características de hibridiza- ção de sondas de arranjos e moléculas visadas.
Freqüência de interação Freqüências de ligação de quantificação de frag- mentos de restrição dão uma medida de suas freqüências reti- culadas. Adequadamente, isto pode ser obtido usando PCR usa- do em tecnologia 3C convencional descrita por Splinter et at. (2004) (supra). Resumidamente, a formação de produtos PCR pode ser medida varrendo as intensidades de sinal após a separação em brometo de etídio manchado em gel de agarose, usando um imageador Typhoon 9200 (Molecular Dynamics, Sunny- vale, CA). Adequadamente, diversos controles são usados para a interpretação correta de dados também descritos em Splin- ter et at. (2 004) [supra).
Uma vez que a tecnologia 4C aqui descrita fornece para a análise de alta produção da freqüência de interação de duas ou mais sequências de nucleotídeos no espaço nucle- ar, prefere-se que as freqüências de ligação de fragmentos de restrição sejam quantificadas usando os arranjos aqui descritos.
Para quantificação, sinais obtidos por uma amostra 4C podem ser normalizados com sinais obtidos por uma amostra de controle. Amostra 4C e amostras(s) de controle (s) serão marcadas com marcações diferentes e discerniveis (por exem- plo, corantes) e serão simultaneamente hibridizadas com o arranjo. Amostra(s) de controle (s) conterá(ão) tipicamente todos fragmentos de DNA (isto é, todas segundas seqüências de nucleotideos potenciais que foram ligadas com a primeira seqüência de nucleotideos (visada)) em quantidades equimola- res e, para excluir uma propensão na eficiência de hibridi- zação, elas devem ser similares em tamanho à(s) segunda(s) seqüência(s) de nucleotideos. Assim, o padrão de controle conterá tipicamente DNA genômico (do mesmo fundo genético ao usado para obter o padrão 4C) , digerido tanto com a enzima de restrição primária quanto secundária e marcado pelo mesmo método (por exemplo, iniciação aleatória) como o padrão 4C.
Tal padrão de controle possibilita corrigir, sonda-por- sonda, diferenças na eficiência de hibridização. A normali- zação de sinais de arranjo 4C para controlar sinais de ar- ranjo possibilita expressar o resultado em termos de enri- quecimento em relação a eventos aleatórios. 0 padrão 4C marcado pode ainda ser hibridizado com um arranjo com ou sem uma amostra de controle diferencial- mente marcada e com ou sem um ou mais outros padrões 4C di- ferencialmente marcados. Outros padrões 4C podem ser não re- lacionados a este padrão 4C, por exemplo, ele podem ser obtidos de diferente tecido e/ou obtidos com um conjunto di- ferente de iniciadores inversos de PCR. Por exemplo, o pri- meiro padrão 4C pode ser material do paciente e o segundo padrão 4C pode ser obtido de um sujeito saudável ou uma a- mostra de controle.
Por causa dos rigorosos padrões de hibridização que espera-se encontrar para ré-arranjos genéticos, não será sempre necessário comparar sujeitos doentes com sujeitos saudáveis. Desta maneira, múltiplos (por exemplo, dois ou mais) padrões 4C, cada qual interrogando um locus diferente do mesmo paciente ou sujeito, podem ser hibridizados para um (por exemplo, um ou mais) arranjo.
Os padrões 4C podem ser diferencialmente marcados (por exemplo, com hibridização de duas ou múltiplas cores) e/ou podem ser identicamente marcados no caso de tal loci normalmente residir em diferentes cromossomos ou no mesmo cromossomo a uma distância grande o bastante para sobreposi- ção mínima entre interação de sinais de DNA-DNA. Como um e- xemplo, material de um sujeito com leucemia de célula T pode ser processado para obter padrões 4C para TCR α/δ (marcados em uma cor, a fim de detectar translocações) , e MLL,TALI,H0X11 e LM02 (cada um marcado na mesma segunda cor, a fim de detectar outros ré-arranjos genéticos). Estes cinco padrões 4C podem ser hibridizados para um arranjo, que per- mitirá a análise simultânea em múltiplos loci por um ré- arranjo genômico associado com a doença.
Para quantificação de freqüências de interação, intensidades de sinal absoluto ou razões em relação à amos- tra de controle podem também ser consideradas. Além do mais, sinais de sondas adjacentes no padrão do cromossomo linear podem ser usados para identificar regiões de interação cro- mossomais. Tal informação posicionai é preferivelmente ana- lisada ordenando as sondas no padrão do cromossomo linear e analisando as intensidades absolutas de sinal, ou razões com relação a sinais de padrão de controle, por abordagens de janela deslizante, usando, por exemplo, abordagens de média corrida ou mediana corrida. Método de ensaio Em um aspecto adicional da presente invenção, é fornecido um método de arranjo para identificar um ou mais agentes que modulam uma interação de DNA-DNA.
Da maneira aqui usada, o termo "modular" refere-se a prevenir, diminuir, suprimir, restaurar, elevar, aumentar ou de outra forma afetar a interação de DNA-DNA.
Em alguns casos, pode ser desejável avaliar dois ou mais agentes juntos para o uso em modular a interação de DNA-DNA. Nestes casos, ensaios podem ser facilmente modifi- cados adicionando tal(s) agente(s) adicional(s) tanto simul- taneamente quanto subsequentemente ao primeiro agente. 0 método da presente invenção pode também ser uma seleção, por meio do que inúmeros agentes são testados para modular a atividade da interação de DNA-DNA.
Espera-se que os métodos de ensaio da presente in- venção sejam adequados tanto para seleção em pequena escala quanto em grande escala de agentes, bem como em ensaios quantitativos.
: 0 ^ a ^ ^ e ~ ο - ^ ,-", c: ^ r>. ^ ^ 2. C ü 3 0 C C ϋ -3. ci !Z I Θ S ΰ - i w S _Ii v cZ ydC / w U... ^ ^ S p Γ dii.ã i ^0 VO j. VΐΓΓιΘΠ L. C OO 3 ΓϊίθΟί — Cciílu.SΠ l, Ο ΘΓΓ, (fs ΐ Θ 'wump^ilyCSS _ Ο ΟΓΓιã■_-r“ ·_α ■—-Í-âü que compreendem tais agentes. Um programa de desenvolvimento ie medi carter.~ code, cor exemple, envolver tomar um. agente opcionalmente modificando-o (por exemplo, modificar sua es- trutura e/ou fornecer uma composição inédita que compreende a dita fração) e desenvolver estudos adicionais (por exem- plo, estudos de toxicidade e /ou estudos em atividade, es- trutura ou função). Experiências podem ser realizadas em a- nimais não humanos e podem eventualmente ser realizadas em seres humanos. Tais experiências incluirão de maneira geral determinar o(s) efeito (s) de níveis de dosagem diferentes.
Programas de desenvolvimento de medicamento podem utilizar computadores para analisar frações identificadas pela sele- ção (por exemplo, para prever estrutura e/ou função, para identificar possíveis agonistas ou antagonistas, para pes- quisar outras frações que podem ter estruturas ou funções similares, etc.).
Teste de diagnóstico Atualmente, várias ré-arranjos genômicos continuam difíceis de detectar per técnicas citogenéticas moleculares disponíveis. Embora c arranjo técnica de hibridização ger.ô- mica comparativa (arranjo-CGII) se]a uma técnica recém- desenvolvída para a detecção de amplificação e/ou deleções cremossemais com uma resolução de 35-300 Kb, esta técnica não é adequada para detectar transiocações balanceadas e ín- versões croraossomais. Ter outra lodo, cariotipagem espectral i.SKY; ou cariotipagem convencional é frequentemente realiza- da em material ao paciente para a detecção de translocaçces croraossomais bem como mudanças numéricas, mas a resolução para definir ponto de ruptura de translocação é baixa, fre- qüencemente 1C-1C Mb e 510 Mb, respectivamente. Consequente- mente, resultados cbtidcs por ambos métodos e especialmente SKY levarão a experimentos validações demorados e de muita mão-de-obra como hibridização in situ de fluorescência (FI — SH) e de estratégias de clonagem de ponto de ruptura molecu- lar.
Tecnologia 4C envolve um procedimento que pode de- tectar qualquer ré-arranjo croraossomal com base nas frequên- cias da interação entre sequências alteradas de DNA fisica- mente ligadas. Tecnologia 4C é, portanto, usada para a iden- tificação de (recorrente) ré-arranjos cromossomais para a maioria dos males humanos / más formações congênitas múlti- plas ou retardo mental. Uma vantagem importante da tecnolo- gia 4C é que ela permite o mapeamento muito preciso do ponto de ruptura para uma região de semente diversos milhares de pares de base. Uma outra vantagem de tecnologia 4C é que ne- nhum conhecimento anterior é requerido na posição exata do pciito de ruptura, uma vez que pontos de ruptura serão detec- táveis mesmo quando a sequência 4C bait estiver localizada 1-5 Mb fera ac ponto de ruptura. Isto tem também a vantagem que a mesma seqüência bait pode ser usada para a detecção de ré-arranjos cromossomais específicos cobrindo grandes áreas de ponto de ruptura. 0 mapeamento preciso de ré-arranjos ge- JíOÍLl_LwO^· fjeia "d1-. tuoti-^niO ^ .-dCtC^^l^-^i cão de qer.e >'s· aberrancerr.ente expresso is; que dãc suporte u doenças ou desordens genéricas que contribuirão i.xportante- mente para um melhor entendimento das correlações gencripc- di C ü_ CIIci II Z C LTI.d. y ciO _LÍUp 1 d cs. 11, ô -dlti p í_ vv Cf I j.C 3 <_ _u JC .
Em um.a modalidade da presente invenção, a fim de fornecer uma base para o diagnóstico ou prognóstico de doen- ça, são estabelecidos valores normais ou padrões de um su- jeito. Isto pede ser obtido testando amostras tomadas de su- jeitos normais - tal como animais ou humanos. A freqüência da interação de DNA-DNA pode ser quantificada para compará- la com uma série de diluição de controles positivos. Em se- guida, valores de padrão obtidos de amostras normais podem ser comparados com valores obtidos de amostras de sujeitos afetados ou potencialmente afetados por uma doença ou uma desordem. 0 desvio entre valores padrões e do sujeito esta- belece a presença do estado da doença.
Tais ensaios de diagnóstico podem ser feitos sob medida para avaliar a eficácia de um regime de tratamento terapêutico particular e pedem ser usados em estudes ani- mais, em experiências clinicas, cu em monitoramento de tra- tamento de um paciente individual. A fim de fornecer uma ba- se para o diagnóstico de doença, pode-se estabelecer um per- fil normal cu padrão para a interação de DMA-CNA. Valeres de padrão obtidos de amestras normais pedem ser comparados ccm valores obtidos de amostras de sujeitos potencialmente afe- tados per uma desordem ou doença. 0 desvio entre valores pa- 0 Θ dv6f.Ça *ΟΓ - ^.Τί 0 G Θ 3 0 Θ ^ΙΘ.Γ·τϊΡΘ’ϋ.^_33 cXl S ιθΓ06 pode ser administrado, e o perfil do tratamento ou valores podem ser gerados. Finalmente, o método pode ser repetido em -ir-,-. z- p 3 C Cs V d ^ ' 1 =; V pt ra q ’ * q Ί ^ .q q qs q*· <q y- ·-* v - ^ τ ^ — _q ■/-r ou oor.tra ^ m.odeio normal ou padronizado. Ferfis de tra- tamento sucessivos podem ser usados para mostrar a eficácia do tratamento por um período de diversos dias ou diversos meses. A tecnologia 4C detecta precisamente pelo menos 5 Mb de DNA genômico ligado em cis com a seqüência de nucleo- tídeos que é analisada (ver Figura 2-3 e 5). Vantajosamente, a tecnologia 4C pode ser usada para detectar qualquer aber- ração genômica que é acompanhada por uma mudança em separa- ção do sitio genômico entre sequências ré-arranjadas e uma seqüência 4C (bait) de escolha. Tal mudança pode ser, por exemplo, um aumento ou diminuição na separação do sítio ge- nômico, ou pode ser uma subrepresentação (como em dele- ção(s)), ou sobrerepresentação (como em duplicações) de se- quências proximais (por exemplo, de até 15 Mb ou mais) com a seqüência 4C (bait). Tipicamente, tais aberrações gencmicas ou ré-arrar.jcs são uma causa ou estão associados com doenças - tais como câncer (por exemplo, leucemia) - e outras doen- ças genéticas ou congênitas aqui descritas.
Aberrações genéticas vpor exemplo, aberrações ge- ncmicas ou cromosscmais - tais ccmc aberrações gencmicas ou cremossomais balanceadas e/ou ou não balanceadas) incluem, mas sem limitações, ré-arranjos, translocações, inversões, 010.1.0^^*30 *3 l. j.áò íllulüÇG^S GG ac ide GUCj-CICC vCCC exemple, crcr.osscccs; e também perdas cu ganhos de parte cu tedes cs cromcsscir.es. elas sãc a causa principal de desor- dens genéticas cu doenças, ir.ciuinQO ctescroens congênitas e aü_k-s c r omo s s oruos sd^ ^n^^-^v-^acs, ^esta ma η o ^ r u, genes (cu fragmentes de genes; são removidos dc contexto fi- siológico normal de um cromossomo particular e são localiza- dos em um cromossomo recipiente, adjacente a genes não rela- cionados ou fragmentos de genes (frequentemente cncogenes ou proto-oncogenes) .
Males podem incluir leucemias agudas, linfomas ma- lignos e tumores sólidos. Exemplos não limitantes de altera- ções são t(14;18) que ocorrem freqüentemente em NHL; t(12;21) que é freqüentemente encontrado em infância precur- sor-B-ALL; e a presença de llq23 (MLL (leucemia linfóide mi- elóica ou leucemia de linhagem misturada) gene) aberrações em leucemias agudas. 0 gene MLL na região do cromossomo llg23 é envol- vido em diversas translocações tanto em leucemias ALL quanto mielóide aguda (AMD . Até hoje, pelo menos dez genes parcei- ros foram identificados. Algumas dessas translocações, tais como t(4;li) Íq21; g23), h(11; 19) Íq23; pl3) e t(l;ll) (p32; q23), ocorrem predominantemente em ALL, onde outros, como t(i;11} í q21; q23), t(2;11) 'p 21; q2 3;, t(6;11) (q27; q23) e t(9;11) 10 (p22; q23) são mais frequentemente obser- vados em AML. Ré-arranjos envolvendo a região llq23 ocorrem muito frequentemente em leucemias agudas infantis (em torno c_ · υ ·.· Γ c e.u uma extensão mu 11 c rr.cr.^r -err. leucernoac r.a in- fância e adulta (cada qual em torno 5 %; . Ré-arranjcs em. tales iinícides frequentemente en- volvem genes Ig cu TCP.. Exemplos incluem cs três tipos de t rans locações (t ( ? ; 11) , t ; Ξ ; 9 , e t (9; 22} ) que ^"oontra- cadeia pesada Ig (IGH), kappa Ig (IGK), ou lam.bda Ig (IGL} segmentos do gene, respectivamente. Um outro tipo comum de translocação nesta categoria é t(14;18) (q32 ;q21) que é ob- servado em cerca de 90 % de linfomas foliculares, um dos ti- pos NHL principais. Nesta translocação gene BCL2 é ré- arranjado em regiões dento do locus IGH dentro ou adjacente aos segmentos do gene TH. 0 resultado dessa aberração do cromossomo é o sobreexpressão da proteína BCL2, que desempe- nha um papel como um fator de sobrevivência no controle do crescimento, inibindo a morte de célula programada. O gene BCL2 consiste em três exons, mas esses são dispersos em uma grande área. Desses, o último exon codifica uma grande região não traduzida de 3' (3' UTR). Esta UTR 3' é uma das duas regiões em que muitos pontos de ruptura t(14; 18) são agrupados e é denominado a "região do ponto de rup- tura principal"; a outra região de ponto de ruptura envolvi- da em translocações t(14; 18) fica localizada 20-30 kb à ju- sante do locus 3CL2 e é denominada a "menor região de agru- pamento". Uma terceira área de ponto de ruptura, BCL2 o VCR (região de agrupamento variante), é localizada no lado de 5' do locus 3CL2 e está entre outras coisas envolvida em trans- locações variantes, isto é, t(2;18) e t(18;22), em que seg- i [. 1 l. id '-, 1 td Uci.c: _l 'v_j i\ c 3 d. ■·._> 03 JcTíCí paZCCIIC . .ASSim, 3 OlOuiO 08 ΘΧ6ΓΠ0_0, 0 0 ΟΠΟ _l C Cj 1 â 4 C pCÒ6 S8! aplicada à seleção de xaterial ac paciente para aberrações genéticas próximas ou em Icci que foram escolhidos com base jLiX θηρ _l ^ S íid.O iiniit-âíildd aüj-c-Lu-laii 0.8 1 ci _ iOC_ SOO Au'7 δ_, I r MLL, MYC, BCL, 3 CR, ABLI, Icci de imcncglobulina, LYLl, TALl, TAL2, LM02, TCR α/δ, TCR/δ, HOX e outros loci em vá- rias leucemias linfoblásticas.
Vantajosamente, se uma aberração genética é sus- peita, a tecnologia 4C pode ser aplicada como a primeira e única seleção para verificar e mapear a presença da aberra- ção da maneira aqui explicada.
Detecção de ré-arranjos genômicos Em uma modalidade particularmente preferida da presente invenção, os métodos aqui descritos podem ser usa- dos para a detecção de ré-arranjos genômicos.
Atualmente, ré-arranjos genômicos - tais como pon- tos de ruptura de translocação - são muito difíceis de de- tectar. Por exemplo, microarranjos de hibridização genômica comparativos (CGH) podem detectar diversos tipos de ré- arranjcs, mas não conseguem detectar translocações. Se translccaçâc é suspeita em um paciente, mas parceiros cro- mossomo são desconhecidos, cariotipagem espectral (SKY) pode ser realizado para encontrar parceiros de translccaçâc e cb- ter uma estimativa aproximada dos locais de ponto de ruptu- ra. Entretanto, a resolução é muito fraca (frequentemente r.ãc maior que -50 Mb) e é frequentemente necessário o mapea- mento fino adicional (que é tanto demorado quanto caro). Is- to é normalmente feito usando hibridização in situ de fluo- rescência (FISH), que novamente fornece resolução limitada.
Usando FISH, pontos de ruptura podem ser localizados até +/- 50 kb da região em resolução máxima.
Freqüências da interação de DNA-DNA basicamente são função da separação do sitio genômico, isto é, as fre- qüências de interação DNA-DNA são inversamente proporcionais à distância linear (em quilobases) entre dois loci de DNA presentes no mesmo padrão de DNA físico (Dekker et at., 2002). Assim, uma translocação, que cria um ou mais novos padrões DNA físicos, é acompanhada por interações de DNA-DNA alteradas próximo aos pontos de ruptura, e isto pode ser me- dido pela tecnologia 4C. Doenças com base nas translocações são tipicamente causadas por interações de DNA-DNA aberran- tes, já que as translocações são o resultado da ligação fí- sica (interação) de braços de cromossomo quebrados (DNA).
Desta maneira, para a detecção de translocações, tecnologia 4C pode ser usada para identificar as interações de DNA-DNA que são diferentes entre sujeitos doentes e não doentes. A titulo de exemplo, tecnologia 4C pode ser apli- cada à seleção de material do paciente para translocações próximas aos loci que foram escolhidos com base nas suas as- 25 ^sociações freqüentes com um dado fenótipo clínico aqui descrito.
Se houver suspeita de translocação em um paciente, iridS Ob UaLi-ciiuS 'w... J_ Oi liw 3 3 Gni^ 5 Íuicíu CÍ6 3 C·^ Γι3 C C 3 d C G , Lim rTiUCCd"” mente inicial pede ser realizado usando métodos atualmente disponíveis ecrr.e caricoipagerrÍ espectral ;SKY;· . Isco ccde i- áeic.x^cai os ρdrse_ros Oc lγ^Γ:^^αçao e icrrecsr uma cstr — mu t iva bastante grosseira dos 1 o c a i s de ron t o d^ rnntc^.a v i-1CiCvrnL.e Uciv á.aj.'ji gwtê "" -j-v .jiC ■ iccriCxOgia \ 4C pede em seguida ser aplicada, usando sequências 'fcait' nesta região localizada, por exemplo, a cada 2 Mb, 5 Mb, 10 Mb, 20 Mb (ou outros intervalos aqui descritos) para mapear finamente o ponto de ruptura e identificar por exemplo o(s) gene(s) que é(são) mal-expressos em decorrência da translo- cação.
Tipicamente uma translocaçâo será identificada por meio de uma transição abrupta de freqüèncias da interação baixa para alta em um cromossomo sem ser o que contém a se- qüência bait 4C, ou em qualquer lugar nesse mesmo cromosso- mo .
Em uma modalidade preferida, a amostra do sujeito é em um estado pré-maligno.
Em uma modalidade preferida, a amostra do sujeito consiste em liquides amníóticcs cultivados ou não cultivados obtidos per amniccentesis para diagnóstico pré-natal.
Em um desenho do arranjo preferido, sondas presen- tes em um arranjo simples representam o genoma completo de uma dada espécie em máxima resolução. Assim, arranjos para detectar trar.s^ccaçces e similares pela tecnologia 4 C contêm scr.das aqui descritas complementares, de cada lado de cada sitio de reconhecimento da enzima de restrição primária no genoma de uma dada espécie (por exemplo, humana).
Em um outro desenho preferido, sondas presentes em um arranjo simples representam o genoma completo de uma dada espécie, mas não em máxima resolução. Assim, arranjos para detectar translocações e similares pela tecnologia 4C contêm sondas aqui descritas que são complementares a somente um lado de cada sitio de reconhecimento da enzima de restrição primária no genoma de uma dada espécie (por exemplo, huma- na) .
Em um outro desenho preferido, sondas presentes em um arranjo simples representam o genoma completo de uma dada espécie; mas não em máxima resolução. Assim, arranjos para detectar translocações, deleções, inversões, duplicações e outros ré-arranjos genômicos pela tecnologia 4C contêm son- das aqui descritas que são complementares a um lado de cada outro sitio de reconhecimento da enzima de restrição primá- ria ordenadas junto com o padrão linear do genoma de uma da- da espécie (por exemplo, humana).
Assim, arranjos para detectar translocações, dele- ções, inversões, duplicações e outros ré-arranjos genômicos pela tecnologia 4C contêm sondas aqui descritas que repre- sentam cada qual um fragmento de restrição simples, obtido após a digestão com uma enzima de restrição primária. Prefe- rivelmente, isto é obtido ignorando cada segunda, terceira, quarta, quinta, sexta, sétima, oitava, nona, décima, vigési- ma, trigésima, quadragésima, quinquagésima, sexagésima, sep- tuagésima, octagésima, nonagésima ou centésima etc., sonda que hibridiza para o mesmo fragmento de restrição. Arranjos para detectar translocações, deleções, inversões, duplica- ções e outros ré-arranjos genômicos pela tecnologia 4C podem conter sondas aqui descritas que são distribuídas igualmente junto com os padrões do cromossomo lineares. Preferivelmen- te, isto é obtido ignorando uma ou mais sondas nas regiões genômicas que apresentam a mais alta densidade de sonda.
Em um outro desenho preferido, sondas presentes em um arranjo simples representam o genoma completo de uma dada espécie, mas não em resolução máxima. Assim, arranjos para detectar translocações, deleções, inversões, duplicações e outros ré-arranjos genômicos pela tecnologia 4C contêm son- das aqui descritas complementares a um lado de cada tercei- ro, quarto, quinto, sexto, sétimo, oitavo, nono, décimo, vi- gésimo, trigésimo, quadragésimo, quinquagésimo, sexagésimo, septuagésimo, octagésimo, nonagésimo, ou um centésimo etc. , sítio de reconhecimento da enzima de restrição primária or- denadas junto com o padrão linear do genoma de uma dada es- pécie (por exemplo, humana). Arranjos para detectar translo- cações, deleções, inversões, duplicações e outros ré- arranjos genômicos pela tecnologia 4C pode conter sondas a- qui descritas, que representam o genoma completo, mas com uma sonda simples cada 100 quilobases. Arranjos para detec- tar translocações, deleções, inversões, duplicações e outros ré-arranjos genômicos pela tecnologia 4C pode contêm sondas aqui descritas que representam cada sítio de reconhecimento de enzima de restrição primária simples no genoma que pode ser representado por uma seqüência de sonda única.
Em um outro desenho de arranjo preferido, sondas aqui aescruds em uin diidi. υ s iitipj.cs LepicScntãrri rc^iòcc gc~ nômicas de um dado tamar.hc - tal como cerca de 50 kb, ICC ko, 2CC kc, 30 0 kb, 4CC kb, 5CC kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 5 Mb, 3 Mb ou 10 Mb -per exemplo, cerca de 0 0 kb 1C Mb) cm torne de cede loci conhecido 3 ^er ] it ηο em trans xCCâ Ç CGS, CieJ_0ÇC0S^ iIiV0I5Oc3; Uápj.±CaÇCcS 0 CcxtllTCS ré-arranj os genôznicos.
Em um outro desenho de arranjo preferido, sondas aqui descritas em um arranjo simples representam regiões ge- nômicas de um dado tamanho - tal como cerca de 50 kb, 100 kb, 2 00 kb, 300 kb, 4 00 kb, 500 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb ou 10 Mb (por exemplo, cerca de 50 kb-10 Mb) em torno um seleção de loci conhecidos envolvi- dos em translocações, deleções, inversões, duplicações e ou- tros ré-arranjos genômicos. Seleções podem ser feitas em critérios educados, por exemplo, eles podem representar so- mente os loci que são implicados em um dado tipo de doença.
Em um outro desenho de arranjo preferido, sondas aqui descritas em um arranjo simples representam uma região genômica de interesse de, por exemplo, 100 kb, 200 kb, 300 kb, 40C kb, 500 kb, 600 kb, 700 kb, 800 kb, 900 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb, 10 Mb, 2 0 Mb, 30 Mb, 40 Mb, 50 Mb, 60 Mb, 70 Mb, 80 Mb, 90 Mb, cu ICO Mb (por exemplo, 100 kb-10 Mb) (parte de) um cromossomo ou múl- tiplos cremos somes, com cada sonda sendo representada múlti- plas (por exemplo, 10, 100, 1000) vezes para permitir medi- ções quantitativas de intensidades de sinal de hibridisação em cada seqüência de sonda.
Em um desenho experimental preferido, a seqüência 4C (bait) é em cerca de 0 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb 10 Mb, 11 Mb, 12 Mb, 13 Mb, 14 Mb ou 15 Mb (por exemplo, cerca de 0-15 Mb) ou mais da seqüência ré-arranjada atual (isto é, ponto de rup- tura no caso de uma translocação).
Em uma hibridização preferida, dois padrões 4C
marcados diferencialmente obtidos com uma seqüência (4C bait) de um sujeito doente e não doente são hibridizados si- multaneamente com o mesmo arranjo. Diferenças nas interações de DNA-DNA permitem a detecção do ponto de ruptura em cis (no mesmo cromossomo como o 4C bait) e em trans (no parceiro de translocação).
Em uma hibridização preferida, múltiplos padrões 4C diferencialmente marcados obtidos com uma seqüência (4C bait) de sujeitos doentes e não doentes são hibridizados si- multaneamente com o mesmo arranjo. Diferenças nas interações de DNA-DNA permitem a detecção do ponto de ruptura em cis (no mesmo cromossomo como o 4C bait) e em trans (no parceiro de translocação).
Vantajosamente, análise multicor, em vez de duas cores, em raicroarranjos pode ser utilizada, permitindo a hi- bridização simultânea de mais que duas amostras com um ar- ranjo simples. Desta maneira, hibridização multicor pode ser usada em tecnologia 4C.
Em uma hibridização preferida, múltiplos padrões 4C diferencialmente marcados obtidos com uma seqüência (4C bait) de sujeito doentes e um padrão 4C diferencialmente marcado de um sujeito não doente são hibridizados simultane- amente com o mesmo arranjo. Diferenças nas interações de DNA-DNA permitem a detecção do ponto de ruptura em cis (no mesmo cromossomo como o 4C bait) e em trans (no parceiro de translocação).
Em uma outra hibridização preferida, dois padrões 4C diferencialmente marcados do mesmo sujeito não doente, obtidos com duas seqüências diferentes (4C baits) que cada representa um outro parceiro de translocação possível, são hibridizados simultaneamente com o mesmo arranjo. Agrupamen- tos de sinais de hibridização fortes observados no padrão linear dos cromossomos não relacionados com o cromossomo que leva a seqüência de interesse (4C-bait) identificarão o cro- mossomo parceiro de translocação e o ponto de ruptura no parceiro de translocação.
Em uma outra hibridização preferida, múltiplos pa- drões 4C diferencialmente marcados do mesmo sujeito não do- ente, obtidos com múltiplas diferentes seqüências (4C-baits) que representam cada qual um outro parceiro de translocação possível, são hibridizados simultaneamente com o mesmo ar- ranjo. Agrupamentos de sinais de hibridização fortes obser- vados no padrão linear dos cromossomos não relacionadas com o cromossomo que leva a seqüência de interesse (4C-bait) i- dentificarão o cromossomo parceiro de translocação e seu ponto de ruptura para a seqüência de interesse.
Material usado para a detecção de translocações, deleções, inversões, duplicações e outros ré-arranjos genô- micos pela tecnologia 4C pode ser obtido por reticulação (e processo adicional, descrito) de células vivas e/ou células mortas e/ou lisatos nucleares e/ou cromatina isolada etc. (aqui descrito) de sujeitos doentes e/ou não doentes.
Detecção de Inversões Inversões (por exemplo, inversões balanceadas) não podem ser detectadas por métodos - tal como técnica de hi- bridização genômica comparativa - mas podem ser detectados pela tecnologia 4C particularmente quando a inversão (balan- ceada) está perto (por exemplo, até cerca de 1-15 Mb ou mais) da seqüência 4C (bait).
Detecção de inversões (balanceadas) é baseada na identificação das interações de DNA-DNA que foram diferentes entre sujeitos doentes e não doentes. Inversões mudarão a posição relativa (em quilobases) no padrão de DNA físico de todas seqüências da região ré-arranjada (mas o mais central- mente localizado) medida contra uma seqüência próxima no mesmo cromossomo que é tomado como seqüência 4C (bait). Uma vez que freqüências da interação de DNA-DNA são inversamente relacionadas com a separação do sítio genômico, sujeitos do- entes darão parceiros inversos de intensidades de hibridiza- ção para todas as sondas localizadas na região genômica ré- arranjada, comparado com um sujeito não doente. Assim, tec- nologia 4C permite a identificação de posição e tamanho de inversões (balanceadas).
De acordo com este aspecto da presente invenção, um desenho do arranjo dedicado preferido compreende sondas em um arranjo simples representando regiões genômicas de um dado tamanho - tais como cerca de 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb ou 10 Mb) (por exemplo, 50 kb-10 Mb) em torno do locus no qual a inversão ou outro ré-arranjo é suspeita.
Em um outro desenho do arranjo dedicado preferido, sondas em um arranjo simples representam regiões genômicas de um dado tamanho (50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb, 2 Mb etc.) em torno do locus no qual a inver- são ou outro ré-arranjo é suspeita. Para análise quantitati- va confiável de intensidades de sinal a quantidade de sonda presente no arranjo é tipicamente em grande excesso para a quantidade de fragmentos cognatos que são hibridizados com o arranjo. Portanto, pode ser necessário ter cada sonda pre- sente múltiplas vezes no arranjo (por exemplo, 10, 20, 50, 100, 1.000 vezes etc.). Além do mais, pode ser necessário para titular a quantidade de padrão que deve ser hibridizado com o arranjo.
Detecção de deleções A detecção de deleções é baseada na identificação das interações de DNA-DNA que foram diferentes entre sujei- tos doentes e não doentes. Deleções resultarão na ausência de interações de DNA com uma seqüência 4C (bait) localizada próximo (por exemplo, cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15 Mb ou mais) na região deletada. Is- to pode resultar na ausência completa de sinais de hibridi- zação para todas sondas localizadas na região ré-arranjada, se a deleção estiver presente em ambos alelos (homozigotos), ou uma redução para sujeitos doentes em função de não doen- tes de intensidades de sinal, se a deleção estiver presente somente em um alelo (heterozigoto). Deleção coloca seqüên- cias distais em proximidade imediata no padrão de DNA fisico com a seqüência 4C analisada (bait), que resultará em sinais de hibridização maiores para sondas localizadas diretamente além da região deletada.
Detecção de duplicação(s) Detecção de duplicação é tipicamente baseada na identificação das interações de DNA-DNA que são diferentes entre sujeitos doentes e não doentes. Sondas na região du- plicada apresentarão maiores sinais de hibridização com uma seqüência 4C (bait) localizada próximo da região ré- arranjada (por exemplo, cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15 Mb ou mais), comparado com sinais de um sujeito não doente de controle. Sondas além da região duplicada são adicionalmente separadas umas das outras da seqüência 4C e, conseqüentemente, apresentarão menores si- nais de hibridização, comparados com sinais de um sujeito não doente de controle.
Preferivelmente, um aumento ou uma diminuição na freqüência de interação DNA-DNA para a amostra do sujeito comparada com o controle é indicativo de uma duplicação ou inserção.
Preferivelmente, um aumento na freqüência de inte- ração de DNA-DNA para a amostra do sujeito comparada com o controle e/ou uma redução na freqüência de interação de DNA- DNA para regiões mais distantes é indicativo de uma duplica- ção ou inserção.
Vantajosamente, a tecnologia 4C pode também ser usada em diagnóstico pré-r.atal. Ácido nuciéicc pede ser obtido de um feto usando vários métodos que são conhecidos ra tecnologia. A titule de miniótico do qual células fetais em suspensão são extraídas e cultivadas por diversos dias (Mercier & Bresson (1995) Am.
Gnt., 38, 151-157). Ácido nucléico das células pode ser em seguida extraído. A coleção de choreal villi pode possibili- tar a dispensa da etapa de cultura e evitar a coleta de fluido aminiótico. Estas técnicas podem ser aplicadas previ- amente (até 7 semanas de gestação para a coleção de chorial villi e 13-14 semanas for amniocentesis) , mas com um risco de aborto ligeiramente maior.
Uma coleta direta de sangue fetal no nível do cor- dão umbilical pode também ser usada para obter ácido nucléi- co, mas tipicamente requer uma equipe de médicos de especia- lizada nesta técnica (Donner et at. (1995) Fetal Diagn.
Ther.,10, 192-199).
Vantajosamente, aberrações genéticas (por exemplo, aberrações genômicas ou cromcsscmais) - tais como ré- arrar.jcs, translccações, inversões, inserções, deleções e cutras mutações em crcmcsscmcs e ácido nucléico - pedem ser detectadas neste estágio.
Preferivelmente, aberrações genéticas (por exem- plo, aberrações genômicas cu crcmcsscmaí s) - tais como ré- arranjos, translocações, inversões, inserções, deleções e ^uLÜaS iiiuuaÇucS ciTi vLuJ.oSSOíuwS δ a. f T 3 , _t , Λ O lí í <ò l. clíuD fc:ii.i perdas ou ganhes de parte ou tedos cs cromossomos 21, 18, 13, X ou Y pedem ser detectadas, uma vez que esses são os cromossomos em que ocorre a maioria de aberrações no feto.
^ 7 ^ p; Γ' r-·. Ci ^ C T T~ i ^ Cl " ~f~ to .-r 7" dJ :"· S i ^ _tJ λ "CcCliG^OCf j-ct “i v- GciiUCeíLl p0iTi'[í—L ô ci GG L0£IuGnGÇa.C· Jc sítios de integração genômiccs de vírus e transgênicos, etc., também quando múltiplas cópias são inseridas em dife- rentes posições no genoma (descrito na Figura 4}.
Predisposição Determinante para adquirir certas translocações Vantajosamente, a tecnologia 4C pode também ser aplicada aos sujeitos não doentes para medir o ambiente ge- nômico de loci freqüentemente envolvido em aberrações gené- ticas. Desta maneira, é possível determinar a predisposição do sujeito em adquirir certas aberrações genéticas.
Assim, além dos usos médicos aqui descritos, a presente invenção pode ser usada em diagnóstico.
Sujeito 0 termo "sujeito" inclui mamíferos - tais como a- nimais e seres humanes.
Agente 0 agente pode ser um composto orgânico ou outro ccmposto químico. 0 agente pode ser um composto, que é obte- nível ou produzido per qualquer fente adequada, seja natural ou artificial. 0 agente pode ser uma molécula de aminoácido, um polipeptídeo, ou um derivado químico destes, cu uma com- binação destes. 0 agente pode ainda ser uma molécula de po- x v + ν' 3^—1. 'wiITí-Cí *ιι^ i cCu j.ü o c: ΓΪ. < lCl>^ w α j i u _^ ' ' sentido, ou um anticorpo, por exemplo, um anticorpo policio- n.al, um anticorpo monoclcnai cu um anticorpo humanizado mc- noclcnai. rJ y~ -i aç 0 3 *h ΓΡ,4· 0 O 1 3 5 f Ο 2Γ3Τ Π.Θ ^ 0"^ t·"' 1 ΐ '^3 S Γ^Γ3 o T^dU” Σλ3 άΠιΙΟυ JpoS IT.uhOpxCnaiS ^CITi Ca Γ à, Cl. Θ L Θ 5 iC lÍiTlcí Π O f Cuc θ.ί.ίΓΓι^’" na a necessidade de uma linha celular humana de produção de anticorpo. Por exemplo, anticorpos monoclonais de camundongo usados foram "humanizados" ligando regiões variáveis de roe- dor e regiões constantes de ser humano (Winter, G. and Mils- tein., C. (1991) Nature 349, 293-299). Isto reduz a imunoge- nicidade humano anticamundongo do anticorpo, mas imunogeni- cidade residual é retida em virtude da estrutura da região V estranha. Além do mais, a especificidade de ligação antigeno é essencialmente que de o murino doador. Enxerto de CDR e estrutura de manipulação (EP 0239400) tem melhorado e refi- nado a manipulação de anticorpo até o ponto onde é possível produzir anticorpos murino humanizados que são aceitáveis para uso terapêutico em humanos. Anticorpos humanizados po- dem ser obtidos usando outros métodos bem conhecidos na tec- nologia (por exemplo, descrito em US-A-239400) .
Os agentes podem ser anexados a uma entidade (por exemplo, uma molécula orgânica) por um ligante que pode ser um ligante bífuncional hidrolisável. A entidade pode ser projetada ou obtida de uma bi- blioteca de compostos, que pode compreender peptideos, bem como outros compostos, tais como pequenas molécula orgâni- cas . Γ'α I ι_ L. LA J_ tb ί-ΛΟΐΙΙ^α.'»' / Ci Cli 1 L. -uü's^^ k_- w LU. Ç. ^ ÇÇ L_ La. l L <_λ l3 >—■ ■—'· tância natural, uma macromolécula biológica, ou um extrato feito de materiais biológicos tais ccrr.c baczéria, fungo, ou animal (particularmente mamífero; células ou tecidos, uma rr2. p; ]_ 2TQ3Π ϊ_ CO Oi i ■ iTf] Z_ ^ O — O â ^ Ϊ ^3 / !"!ΠΊ 3 θ'0^ I- ·ρ S 1 ^ t ét ^ - i}ti 3-^0131.0 ScíTlí iTibc l ICü ^ α*Τι ΓΠ j_ ΠΊ. 6 "Z. ± C C 0 5 "L Z. u t J. 33 j. υά funCICr.â , um peptídeo, um peptidomiméticc, um peptídeo clivado de urr.a proteína total, ou um peptídeo sintetizado sinteticamente (tal como, a título de exemplo, tanto usando um sintetizador de peptídeo quanto por técnicas recombinantes ou suas combi- nações, um agente recombinante, um anticorpo, um agente na- tural ou um não natural, um proteína de fusão ou equivalente destes e mutantes, derivados ou suas combinações.
Tipicamente, a entidade será um composto orgânico.
Para alguns casos, os compostos orgânicos compreenderão dois ou mais grupos hidrocarbila. Aqui, o termo "grupo hidrocar- bila" significa um grupo que compreende pelo menos C e H e pode opcionalmente compreender um ou mais outros substituin- tes adequados. Exemplos de tais substituintes podem incluir halo-, alcóxi-, nitro-, um grupo alquila, um grupo cíclico etc. Além da possibilidade de o substituinte ser um grupo cíclico, uma combinação de substituintes pode formar um gru- po cíclico. Se o grupo hidrocarbila compreender mais que um C, então cs carbcncs não precisam necessariamente ser liga- dos uns acs outros. Por exemplo, pelo menos dois des carbo- nos podem ser ligados por meio de um elemento ou grupo ade- quado. Assim, o grupo hidrocarbila pode conter heteroátomos.
Heteroátomos adequados serão aparentes aos versados na tec- no 1 cai a e ir.::'. ver, rrf *v^r' -, ---r.xrfre, nitrogênio e cxigl~- r.ic. Para algumas aplicações, preferivelmente a entidade cca.prsir.os pe_c r.sr.cs urr. grupe cic^ícc . w grupo c pede ser um arucc cclicíciico, tal ccmc· urt grupe pcliciciicc r.ac fundido. Para algumas aplicações, a entidade compreende ρρ{~ yr.er.es urr des di- os arv.pc? cí cli res li gadee c um cuirc grupe hidrocarbila. A entidade pode conter grupes halo - tal como gru- pos de flúor, cloro, bromo ou iodo. A entidade pode conter um ou mais dos grupos al- quila, alcóxi, alquenila, alquileno e alquenileno - que po- dem ser cadeia não ramificada ou ramificada.
Promedicamento Versados na tecnologia percebem que a entidade po- de ser derivada de um promedicamento. Exemplos de promedica- mentos incluem certos grupos protegidos que podem não possu- ir atividade farmacológica como tal, mas podem, em certos exemplos, ser administrados {tal como oralmente ou parente- ralmente) e depois metabolizados no corpo para formar uma entidade que é farmacologicamente ativa.
Prcmedícamentos adequados pedem incluir, mas sem limitações, Dcxcrubicina, Mitcmicir.a, Mustarda Fer.cl, Metc- traxato, Ancifoiatos, Clcramf er.i col, Camptctecina, 5- rlucruracila Cianeto, Quir.ina, Dipiridamcl e Paciitaxel.
Será mais apreciado que certas frações conhecidas como "pro frações", per exemplo, como descrito em "Desenho de Frcmedicamentcs" por H. Bundgaard, Elsevier, 1985, pedem ser colocados em funcionalidades apropriadas dos agentes. Γ'[1 q -ϊ ς Γ', Υ~ ι'' Λ*1 p· pj Ί ρ* ρ τη -Ό. ΤΊ f~ ρ> c; c; çj Ρ'^ *“ =¾ τη ρ · Ρ .^ 1_ 1J1 τ_ Η P Ρ Γ Λ 0 S ίΛ Ο Ο CÍ 3. 1. 10 — Υθ Γ. Ç 3. Ο . C agente pede ser r.a forma de um sal farr.aceutica- mente aceitável - tal cemo um sal de adição ácida ou um sal de base - ou um sei va to destes, ir.cluir.de um hidrate deste. Ό m γ* p ι ί ι-η m g, +t -i c· m .n·^ ct ί c 3 H C C[ Y n d 0 V O ^ B 0 ^ ^ C ΐ 3 2. r B" .
Fharm. Sei., 1977, 66, 1-19. 0 agente pode ser capaz de revelar outras proprie- dades terapêuticas. 0 agente pode ser usado em combinação com um ou mais outros agentes farmaceuticamente ativos.
Se forem administradas combinações de agentes ati- vos, então as combinações de agentes ativos podem ser admi- nistradas simultaneamente, separadamente ou seqüencialmente.
Isômeros estéreos e geométricos A entidade pode existir como esteroisômeros e/ou isômeros geométricos - por exemplo, a entidade pode possuir um ou mais centros assimétricos e/ou geométricos e assim po- de existir em duas ou mais formas esteroisoméricas e/ou geo- métricas. A presente invenção contempla o uso de todes os esteroisômeros individuais e isômeros geométricos dessas en- tidades, e misturas destes.
Sal farmacêutico 0 agente pode ser administrado na forma de um sal 0 3 ΓΓΓιά CcUlI CalTie ΓιΐΙ Θ âCeltã V Θ .
Sais farmaceuticamente aceitáveis são bem conheci- dos pelos versados na tecnologia e, por exemplo, incluem os mencionados por Berge et ai, em J. Fharm. Sei., 66, 1-19 ι Ί Cj / / ι ■ ^ a η q m gq i r· ^ n ,q r· i r] .q 3 Hf?s ^1 1 -3 d O ? f Ο ΪΓΓΤ. .0 d C S CÍ0 3 C 1 “ aos que r cr.T.ar^ sais nãc :cxi:cs e incluein es sais ele ri dia- tc, bromidratc, iediorato, nitrato, sulfate, bissulfato, fosfato, hidregenfesfato, acetato, trifluoracetato, gluccna- to, lactatc, sa: icilato, citrato, tartrato, asccrbato, oo- cinato, rr.aleato, fumarato, gluconato, ferotte, bcr.zcatc, me- tanos sul fonatc, etar.ossul f enato, ben zenos sul fc nato e p- toluenossulfonato.
Quando uma ou mais frações acidicas são presentes, sais de adição de base farmaceuticamente aceitáveis adequa- dos podem ser formados de bases que formam sais não tóxicos e incluem os sais alumínio, cálcio, lítio, magnésio, potás- sio, sódio, zinco, e aminas farmaceuticamente ativas tal co- mo dietanolamina.
Um sal farmaceuticamente aceitável de um agente pode ser facilmente preparado misturando soluções do agente e o ácido ou base desejado, da maneira apropriada. 0 sal po- de precipitar a partir da solução e ser coletado por filtra- ção ou pode ser recuperado por evaporação do solvente. 0 agente pode existir em forma polimórfica. 0 agente pode conter um ou mais assimétricos car- bono átomos e, portanto, existe em duas ou mais formas este- roisemérioas. Onde um agente contém um grupo aiqueniia ou alquenileno, isomerísmo cis (E) e trans (Z) pede também o- ccrrer. A presente invenção inclui o esteroísemeros do agen- te individual e, onde apropriado, as formas tautoméricas in- dividual destes, juntes com misturas destes.
Separação de diaesteroisômeros cu isemeros cis e — ν- ^ c; y. f' -S .=> v- f' π ^ p — r r ^ ^ ~ = c p ^ τ T -=· ^ “ ·“■ "; ^ c t ΡΛΓ 9Χ?Γ~ pio, por cristalização fracicnal, cromatograiia ou H.P.L.C. de um mistura esteroíscn.érica dc agente eu um sal adequado ou seus derivado. Um eranfionero individual do agente pede também ser preparado por resolução, tal como por H.P.L.C. do per cristalização fracional dos sais diaesteroiscmériccs formados pela reação do racemato correspondente com um ácido ou base oticamente ativos adequados, da maneira apropriada. 0 agente pode também incluir todas as variações isotópicas adequadas do agente ou um sal farraaceuticamente aceitável destes. Uma variação isotópica de um agente ou um sal farmaceuticamente aceitável destes é definida como um no qual pelo menos um átomo é substituído por um átomo tendo o mesmo número atômico mas uma massa atômica diferente da mas- sa atômica frequentemente encontrada na natureza. Exemplos de isótopos que podem ser incorporados no agente e sais far- maceuticamente aceitáveis destes incluem isótopes de hidro- gênio, carbono, nitrogênio, oxigênio, fósforo, enxofre, flú- or e cloro tal como "H, SH, ~3C, ^C, 15N, ~Ό, lB0, B~P, J“p, "S, ~3F e 3=Ci, respectivamente.
Certas variações isotópicas do agente e saís f ar- maceuticamente aceitáveis destes, por exemple, aquelas em que um isetepe radioativo tai ccnc 3H cu 14C é incorporado, são usadas em medicamento e/ou estudos de distribuição de tecido do substrato. Isótopos titulados, iste é, Ή, e car- bcnc-14, íste é, *"C, são particularmente preferidos por sua facilidade de preparação e detectabilidade. Adícicnaimente, substituição com isotopos tal como deut-ric, isto e, .:H, P'-' de disponibilizar certas vantagens terapêuticas resultando em maior esiac_^ioade rstatc j. icã / por cxsrr.p^o, ..^e-u vida ir. vivo ou exigências dosagem reduziaa e, portanto, po- dem ser preferidos em algumas circunstâncias. Variações iso- tópicas de agente e sais. farmaceuticamente aceitáveis destes desta invenção podem de maneira geral ser preparados por procedimentos convencionais usando variações isotópicas a- prcpriadas de reagentes adequados.
Sal farmaceuticamente ativo 0 agente pode ser administrado como um sal farma- ceuticamente aceitável. Tipicamente, um sal farmaceuticamen- te aceitável pode ser facilmente preparado usando um ácido ou base desejados, da maneira apropriada. 0 sal pode preci- pitar a partir da solução e ser coletado por filtração ou pode ser recuperado por evaporação do solvente. Métodos de síntese química 0 agente pode ser preparado por técnicas de sínte- se química.
Fica aparente aos versados na tecnologia que gru- pes funcionais sensíveis pedem precisar ser protegidos e desprotegidos durante síntese de um composto da invenção.
Isto pede ser obtido por técnicas convencionais, per exem- plo, ccmc descrito em "Protective Grcups ir. Crganic Synthe- sís" by T W Greer.e and PGM Wuts, Jonn Wiley and Sons Inc. (1991), e por P.J.Kcciensid, em "Prctecting Grcups", Georg Theme Verlag <'1994;. É possível, durante algumas das reações, que "··; = ' so-.-er presentes possam, em :2r1·5? "t-:. - ç5es, ser racerr.izados, por exemplo, se for usada uma base em uma reação o cm. um substrato terão um uentro ot_.ec que com- preende um grupo ser.sivel a base. Isto é possível durante, ccr exemclo, uma etapa de guar.ilacão. Ceve ser possível evi- mes de sequência de reação, condições, reagentes, de prote- ção/desproteçãc, etc. como é bem conhecido na tecnologia.
Os compostos e sais podem ser separados e purifi- cados por métodos convencionais.
Separação de diastereômeros pode ser obtida por técnicas convencionais, por exemplo, por cristalização fra- cional, cromatografia ou H.P.L.C. de um mistura esteroisomé- rica de um composto de formula (I) ou um sal adequado ou seus derivados. Enantíômero individual de um composto de formula (I) pode também ser preparado de um intermediário oticamente puro correspondente ou por resolução, tal como por H.P.L.C. do racemato correspondente usando um suporte quiral adequado ou por cristalização fracional dos sais di- astereomérícos formados pela reação do racemato correspon- dente com um ácido ou base de forma adequada oticamente ati- vos . 0 agente pede ser produzido usando métodos quími- cos para sintetizar o agente no tede cu em parte. Per exem- ple, se c agente compreender um peptídeo, então o peptideo pode ser sintetizado por técnicas de fase sólida, clivado da resina, e purificado por crcmatcgrafia líquida preparativa de alto desempenho ipor exemplo, Creighton (1983) Prcteins CD -- ν- · - — ■■VSC ^ r "J V ^ 1 Q ^ ' i ' 3 v rίΤ T—I ΊΓ1 v .—, id ^ — m 3 »"· 'N ■”" “'■ "í 1 .m 1. ■ York SY) . A composição aos peptídecs sintéticos pode ser ccnrirmada por analise ou sequencianentc de amincacido ■■, por exemplo, o orccedir.entc de degradação de Sdman; Creightcn, sopra). riantes, homólogos, derivados, fragmentos ou miméticcs des- tes) pode ser realizada usando várias técnicas de fase sóli- da (Roberge J Y et al (1995) Science 269: 202-204), e sínte- se automatizada pode ser obtida, por exemplo, usando o Sin- tetizador de Peptídeo ABI 43 1 A (Perkin Elmer) de acordo com as instruções fornecidas pelo fabricante. Adicionalmen- te, as seqüências de aminoácido compreendendo o agente podem ser alteradas durante síntese direta e/ou combinadas usando métodos químicos com uma seqüência de outras subunidades, ou qualquer parte destes, para produzir um agente variante.
Derivado químico 0 termo "derivado" ou "derivatizado" da maneira aqui usada inclui modificação química de um agente. Ilustra- tivo de tais modificações químicas seria a substituição de hidrogênio por um grupe halo, um grupe alquila, um grupo a- cila ou um grupo amino.
Modificação química O agente pede ser um agente modificado - tal ccmo, mas sem limitações, um agente quimicamente rr.cdi ficado. A modificação química de um agente pede tanto au- mentar quanto reduzir a interação de ligação de hidrogênio, interação de carga, interação hidrofcbica, interação Van Der Walls ou interação dipolo.
Em um aspecto, o agente pode agir como um modelo para o desenvolvimento de outros compostos (por exemplo, um padrão).
Composições farmacêuticas Em um aspecto adicional, é fornecida uma composi- ção farmacêutica gue compreende um agente identificado pelo método de arranjo aqui descrito misturado com um veiculo farmaceuticamente aceitável, diluente, excipiente ou adju- vante e/ou suas combinações.
Em um aspecto adicional, é fornecida uma composi- ção de vacina que compreende um agente.
Em um aspecto adicional, é fornecido um processo de preparar uma composição farmacêutica que compreende mis- turar um agente identificado pelo ensaio com um diluente, veiculo, excipiente ou adjuvante farmaceuticamente aceitável e/ou suas combinações.
Em um aspecto adicional, é fornecido um método de prevenir e/ou tratar uma doença que compreende administrar a um agente ou uma composição farmacêutica ou uma vacina para um sujeito.
As composições farmacêuticas podem ser para uso humano ou animal em medicina humana e veterinária e compre- enderá tipicamente qualquer um ou mais de um diluente, vei- culo, ou excipiente farmaceuticamente aceitável. Veículos ou diluentes aceitáveis para uso terapêutico são bem conhecidos na tecnologia farmacêutica, e são descritos, por exemplo, em Remington's Pharmaceutical Sciences, Mack Publishing Co. (A. Í_J Új pr. *"· ~ -V" o 3 H -i Q « ' Τα Λ ΰ Λ 2 "-Í í75 τ * Λ ' - - 1 ^ i V ·^ ' >^ ■ .'1 ^ +■ 0 · · di_uente farmacêuti;o pede ser selecionada no senuide oe en- tender a via ds ade,instrução e pratica rarrr.acêütics padrao.
As composições farmacêuticas podem compreender como o veicu- . o f o e x c i ρ i e n t e ou o i mi e n t e u u a _ ctj e r a o e o u a o o c n e _ em de _ e s te(s) de revestimento, agente(s) solubilizante (s) .
Conservantes, estabilizadores, corantes e ainda agentes flaverizantes podem ser fornecidos na composição farmacêutica. Exemplos de conservantes incluem benzoato de sódio, ácido sórbico e ésteres de ácido p-hidroxibenzóico.
Antioxidantes e agente de suspensões podem ser também usa- dos .
Pode haver diferentes exigências de composi- ção/formulação dependendo dos diferentes sistemas de distri- buição. A titulo de exemplo, a composição farmacêutica da presente invenção pode ser formulada para ser administrada usando uma minibomba ou por uma via mucosal, por exemplo, como uma aspersão nasal ou aerossol para inalação ou solução de ingestão, ou parenteralmente em que a composição é formu- lada per uma forma injetável ccm ar, para distribuição, per exemplo, por uma via intraver.csa, intramuscular ou subeutâ- nea. Aiternativamente, a formulação pode ser projetada para ser administrada per inúmeras vias.
Se c agente tiver que ser administrado nucosaiteri- te por meio da mucosa gastrintestinal, ele tem que ficar es- tável durante o trânsito por todo o trato gastrintestinal; por exemplo, ele deve ser resistente a degradação prcteolí- .-,-2 ί;ι·ρ1_ 2 U 4 ■> H C ~i.OC '"'ÍCZ-^OC CÍ C t C 2Γ Cf Ο Γ'. ■ ■ iss da bi-is.
Quando apropriado, as composições farmacêuticas podem ser administradas por inalação, na forma de um supcsi- t crio ou cessário, oocioamenie na forma ia uma ~~-ção, s ~ - u - ção, creme, ungucntc ou po de fu_i.cc, pe^c ^sc de um ccesiiv de pele, oralmente na forma de comprimidos contendo excipi- entes tal como amido ou lactose, ou em cápsulas ou óvulos tanto sozinhos como em misturas com excipientes, ou na forma de elixires, soluções cu suspensões contendo agentes flavo- rizantes ou corantes, ou as composições farmacêuticas podem ser injetadas parenteralmente, por exemplo, intravenosamen- te, intramuscularmente ou subcutaneamente. Para administra- ção parenteral, as composições podem ser bem usadas na forma de uma solução aquosa estéril que pode conter outras subs- tâncias, por exemplo, sais ou monossacarideos suficientes para tornar a solução isotônica com sangue. Para além do mais bucal ou sublingual, as composições podem ser adminis- tradas na forma de comprimidos ou pastilhas que podem ser formulados de uma maneira convencional.
Os agentes podem ser usados em combinação com uma ciclcdextrina. Ciclodextrinas são conhecidas por formar com- plexos de inclusão e não inclusão ccm moléculas de medica- mento. A formação de um complexo medicamento-ciclodextrina pooe modiiicar a soiubiiidade, taxa de dissolução, proprie- dade de bicdisponibíiidade e/ou estabilidade de uma molécula de medicamento. Complexos de medicamento-ciclodextrina são oe .maneira geral usadas para a maioria das formas de dosagem ^ 'J -L- O -Ξ> Ό. tf fl 'Vw-ii l l _i_ * 1 _i_ O ■_- i_ Ci ‘w d '·_> · d :w t l lV „a 1 i . d d -— ._. \1» _._ . * d i_. _i_ w d ·—* _ «_v .. . _^_ ._„ d v direta com o medicamento, a ciclcdextrina pede ser usada ce- rto um aditivo auxiliar, ccr exemplo, as um veicule, diluente c u se^jb_i^zâtL6 . _ c ^ c d e x i- r i n a s u _a, o e t a e cama sac e x e n— __ jj T3.1.S ^ '2 ^T7^* 3 _ ^ ^ ' ^ ‘ j '-t ~ Q •'d ;Ηρ,'Ί’ ’ 2 c .cs p q ·ί· ^ .H q , ^ ν' η ■(“ ."·, r; triu Λ1 d “ ri— ¥ u. / ^ < í- , Λ d *■ *-i ~ J1 "i ,· w· p -· ^ 2 c ^ - A .
Se o agente for uma proteína, então a dita proteí- na pode ser preparada in situ no sujeito que está sendo tra- tado. A este respeito, sequências de nucleotídeos que codi- ficam a dita proteína podem ser distribuídas pelo uso de técnicas não virais (por exemplo, pelo uso de lipossomas) e/ou técnicas virais (por exemplo, pelo uso de vetores re- trovirais) de maneira tal que a dita proteína seja expressa a partir da dita seqüência de nucleotídeos.
As composições farmacêuticas da presente invenção podem também ser usadas em combinação com tratamentos con- vencionais .
Administração 0 termo "administrado" inclui distribuição por técnicas viral ou não viral. Mecanismos de distribuição vi- ral incluem, mas sem limitações, vetores adenovirais, veto- res virais adeno associados (AAV) , vetores virais de herpes, vetores retrovirais, vetores lentivirais, e vetores baculo- virais. Mecanismos de administração não viral incluem trasn- fecção mediada per lipldeos, lipossomas, imunciipessemas, anfifiics faciais cationicos (CFAs) e suas combinações.
Os componentes podem ser administrados sozinhos, mas de maneira gerai serão administrados como uma composição ^ ν- ~ - - £, · - - a _ ^ ^ ν- .Γ·- ν ^ y^· '_C , 2'.! a Γ. ?! Γ ZS 2 2 rr.C cr.2r.tcc 2 Ζ *2 Ζ 2 7?.Ζ'2~ turados com um excipiente, diiuente ou veiculo íarmaceutica- ne n c e djg jvâuc se.cCicr.aao cora iciaçao a — a o ^ 5Q,.;_.. - S a ção visada e prática farrr.acêutica padrão.
Per exemclo, os componentes poder, ser adiro o: sc ra- lações ou suspensões, que podem conter agentes flaverizances ou corantes, para aplicações de liberação imediata, atrasa- da, modificada, pulsada ou controlada.
Se o produto farmacêutico for um comprimido, então os comprimidos podem conter excipientes tais como celulose microcristalina, lactose, citrato de sódio, carbonato de cálcio, fosfato de cálcio dibásico e glicina, desintegrantes tal como amido (preferivelmente amido de milho, batata ou tapioca), glicolato de amido de sódio, croscarmelose sódica e certos silicatos complexos, e aglutinantes de granulaçâo, tais como polivinilpirrolidona, hidroxipropílmetilcelulose (EIPMC), hidroxipropí1celulose (CPC), sacarose, gelatina e acácia. Adicionalmente, agentes de lubrificação tais como estearato de magnésio, ácido esteárico, beenato de glicerila e talco podem ser incluídos.
Composições sólidas de um tipo similar pedem tam- bém ser empregadas comc cargas em, cápsulas de gelatina. Ex- cipientes preferidos a este respeito incluem lactcse, amido, uma celulose, açúcar de leite ou polietileno glicoi de alto peso molecular. Para suspensões aquesas e/cu elixires, o a- gente pede ser combinado ccm vários agentes adoçantes cu flavorizantes, matéria de cor ou corantes, com agentes de etariol, propiler.o giicol e glicerina e suas combinações.
As vias ae sclmnisr raçac , di smburçuvj, podem m.— cluir, “as sen. limitações, um, cu mais de oral ;per exemple, como um comorirr.idc, cápsula, ou -“orno uma soluçar de i nges- CaC. , tCClCC, m_CC£^i_ per C.i.u...p - - , ---- ---- ..aoa-L. ou aerossol para inalação), nasal, parenterai :pcr exem.plo, por uma forma injetável), gastrintestinal, intraespinhal, intrapc-ritoneal, intramuscular, intravenosa, int rauterina, intraocular, intradérmica, intracraniana, intratraqueal, in- travaginal, intracerebroventricular, intracerebral, subeutâ- nea, oftálmica (incluindo intravitreal ou infracameral), transdérmica, retal, bucal, vaginal, epidural, sublingual. Níveis de dose Tipicamente, um médico determinará a real dosagem que será mais adequada para um sujeito individual. 0 nível de dose especifica e freqüência de dosagem para qualquer pa- ciente particular podem variar e dependerão de uma variedade de fatores, incluindo a atividade do composto específico em- pregado, da estabilidade metabólica e extensão de ação desse composto, da idade, peso corpóreo, saúde gerai, sexo, dieta, medo e tempo de administração, taxa de excreção, combinação de medicamente, da severidade da condição particular, e da terapia individual em andamento.
Formulação Ois) componente (s) podei.m) ser formulado (s) em uma ccm,posição farmacêutica, tai como misturando com um cu mais de um veículo, diluente ou excipiente adequado, usando téc- ii.^'wcai ^aü ç^ç^í^íí.g^.uCI.cj.o iia ^GOl^O-.OCJ-Lcj. ^ c θ n ç â Aspectos ce presente ir.vençâc pedem ser ussdcs ρ a — ra o tratamento e/ou prevenção e/ou diagnóstico e/cu preg- nistico òe uma òcerca - r = i ? "r? =>ç ’ ’ ^‘■ed ς '/íb-.-- e o / \i c r o o .
Para facilidade de referência, parte dessa lista é agora fornecida: atividade inibitória de macrófago e/ou ini- bitória de célula T e, assim, atividade antiinflamatória; atividade antiimune, isto é, efeitos inibitórios contra uma resposta imune celular e/ou humoral, incluindo uma resposta não associada com inflamação; doenças associadas com vírus e/ou outros patógenos intracelulares; inibição da capacidade de macrófagos e células T aderirem nos componentes da matriz extracelular e fibronectina, bem como expressão de receptor fas supra-regulado em células T; inibição de reação imune e inflamação indesejadas, incluindo artrite reumatóide, infla- mação associada com hipersensibilidade, reações alérgicas, asma, lupus erítomatoso sistêmico, doenças do colágeno e ou- tras doenças autoimunes, inflamação associada ccm atercscle- rose, artericsclerose, doença do coração aterosclerótico, lesão por reperfusão, parada cardíaca, infarto do miccárdio, desordens inflamatórias vasculares, síndreme do desconforto respiratório ou outras doenças cardiopulmonares, inflamação associada ccm úlcera péptica, colite uicerativa e entras do- enças do trato gastrintestinal, fibrose hepática, cirrose hepática ou outras doenças hepáticas, tireoídite ou outras doenças glandulares, glcmerulonefrite ou outras doenças re- cas, derrearite cu outras deenças dérmicas, dcecyas perrccien- tais cu outras deenças dentárias, orquite ou orquiepididimi- Le, inferti 1 laaue, r a ona crqu_i_duj_ ou o n r ^ s e s—l. ή - ’τ··:'· ■=> r;!; uirfliu, Ί ’ s ~ c ·" ? ã - rna"-"*'ár''a, ■ ~su f· ri - e outras deenças ginecoiógicas imune e/cu inflamatória rela- cionadas, uveite posterior, uveite intermediária, uveíte an- terior, ccnj untivite, corioretinite, uveroretinite, neurite ótica, inflamação intraocular, por exemplo, retinite ou ede- ma macular cistóide, oftalmia simpatética, esclerite, reti- nite pigmentosa, componentes imune e autoimune de doença de fondus degenerativa, componentes inflamatórios de trauma o- cular, inflamação ocular causada por infecção, vítreo- retinopatias proliferativa, neuropatia ótica isquêmica agu- da, cicatriz excessiva, por exemplo, após operação de fil- tração de glauccma, reação imune e/ou inflamação contra im- plantes oculares e outras doenças oftálmicas imune e infla- matórias relacionadas, inflamação associada com doenças ou condições ou desordens autoimunes onde tanto no sistema ner- voso central (CNS) quanto em qualquer outro órgão, supressão imune e/ou de inflamação seria benéfica, doença de Parkin- son, complicação e/ou efeitos colaterais do tratamento de doença de Parkinson, demência relacionada a AIDS, encefalc- patia relacionada a HI7, doença de Devic, Sydenhan chcrea, doença de Alzheirr.er e outras deenças degenerativas, condi- ções ou desordens do CNS, componentes inflamatórios de aci- dentes vasculares, síndreme pcs-póiio, componentes imune e ir.flamatóri es de desordens ps i qu i a t r 1 cas r mieH^e, ei.^efaii te, pan-er.cef alite esclercsante subaguda, encefaicrnielite, neurcpatia aguda, r. europaoia sucaguoa, aeuropstia oronica, sindrome de Guiliaim-Arre, Sydernham chcra, niastenia grave, pseuactumor cerebral, sindrome de Dcwn, door.ça de Hur.t: r.g- tors, esclercse laterar amiotrof íca, componentes inLlãmaLó- rios de compressão CNS ou trauma CNS ou infecções do CNS, componentes inflarrLatórios de atrofias e distrofias muscula- res, e doenças, condições ou desordens imune e inflamatória relacionadas do sistema nervoso central e periférico, infla- mação pós-traumática, choque sético, doenças infecciosas, complicações inflamatórias ou efeitos colaterais de cirurgi- a, complicações de transplante de medula óssea ou outras complicações e/ou efeitos colaterais de transplante, compli- cações inflamatória e/ou imune e efeitos colaterais de tera- pia genética, por exemplo, por causa de infecção com um por- tador viral, ou inflamação associada com AIDS, para suprimir ou inibir uma resposta imune humoral e/ou celular, para tra- tar ou atenuar doenças proliferativas de monócitos ou leucó- citos, ex., leucemia, reduzindo a quantidade de monócitos ou linfócitcs, para a prevenção e/ou tratamento de rejeição de enxerto em cascs de transplante áe células, tecido e órgãos naturais ou artificiais tais ccmo córnea, medula óssea, ór- gãos, lentes, marcapassos, tecido de pele natural ou artifi- cial. Desordens especificas relacionadas a câncer incluem, mas sem limitações: tumores solides; tumores levados pelo sangue tais ccrr, leucemias; metástese de tumor; tumores be- nignos, por exemplo, hemangiomas, neuromas acústicos, neuro- r 1 Π Γ 7ΓΓ.-3. 5 r 11a -..J -1ÍHã tò , tr ^-υ^ΐτι^'ΙΟΙ^ o. -1 L Γ 1_ ti H 11 C 11 ΓΤ1H tóide; psoriase; doenças angiongênicas oculares, por exem- ρ ^ e, rei;r.cpa..a li abs t ^ ca, rec^nccatra de p i err.a , a r ^ daca, deger.eração macular, rejeição de enxerto- de córnea, glauccma necvascular, fibrcplastin retrclertsl, rnbec.se; Sínironc de vSier-acaccr; anu^coênese raro ca r __·^ηα; uecvusc-»_d_‘rzaçsc de placas; telangiectasia; juntas hemofílicas; angiofibroma; granulação de ferida; colaterais coronarianas; colaterais cerebrais; más formações arteriovenosas; angiogênese do mem- bro isquêmico; glaucoma neovascular; fibroplasia retrolen- tal; neovascularização diabética; doenças relacionadas a he- liobacter, fraturas, vasculogêneses, hematopoiese, ovulação, menstruação e placentação.
Preferivelmente, a doença é câncer, tais como leu- cemia linfocítica aguda (ALL), leucemia mielóide aguda (A- ML), câncer adrenocortical, câncer anal, câncer da bexiga, câncer do sangue, câncer dos ossos, tumor no cérebro, câncer de mama, câncer sistema genital feminino, câncer sistema ge- nital masculino, linfoma do sistema nervoso central, câncer cervical, rabdomiosarcoma da infância, sarcoma da infância, leucemia linfocítica crcnica (CLL; , leucemia mielóide crôni- ca (CML), câncer do cólon e retal, câncer do cólon, câncer do endométrio, sarcoma do endcnétrio, câncer do esôfago, câncer des olhos, câncer da vesícula biiiar, câncer gástri- co, câncer do trato gastrintestinal, leucemia da célula ca- pilar, câncer da cabeça e pescoço, câncer hepatocelular, do- ença de Hcdgkir., câncer hipofanngeai, sarcoma de Kapcsi, câncer do rim, câncer da laringe, leucemia, câncer do figa- \_i 'w r C8.nC0 2Γ uu 'w· u u._. i ^ ^ ^ ^ ^ -^7. ■. a Jj.Lí.wju ... ci ^ JL ^ w ·.^ ^.. .C ΓΓ.„* T, 3 x ..i. CJ Γί 3 7 ΓΓ. Θ l. 3 ΓΪ G ΓΓ. 3 f P.6SO uâ 1 lOPd ^ IGI. Θ C Γ33 ΓΓι 3 i. l. 0 p _i_ 3 ^ ΓΓι 3 Θ 01713 7 câncer da cavidade nasal e seics paranasais, câncer r.asofa- r ingeai, câncer do sistema nervoso, neurcfclâstoma, 1inferna cer de paratireóide, câncer do pênis, câncer da faringe, tu- mor da hipófase, necplasma da célula plasma, linfoma primá- ria CNS; câncer de próstata, câncer retal, sistema respira- tório, retinoblastoma, câncer de glândula salivar, câncer de pele, câncer do intestino delgado, sarcoma do tecido macio, câncer do estômago, câncer do estômago, câncer do testículo, câncer da tireóide, câncer sistema urinário, sarcoma uterí- na, câncer vaginal, sistema vascular, macroglobulinemia de Waldenstrom e tumor de Wilms.
Estoj os Os materiais para uso nos métodos da presente in- venção são idealmente adequados para preparação de estojos.
Um estojo como este pode compreender recipientes, com cada um ou mais dos várias reagentes (tipicamente em forma concentrada) usadcs nos métodos aqui descritos, inclu- indo, for exemplo, uma enzima de restrição primária, uma en- zima de restrição secundária, um agente de reticulação, uma enzima de ligação ípor exemplo, um ligase) e um agente para reverter a reticulação (por exemplo, prcteinase K) .
Oiigonucleotideos podem também ser fornecidos em recipientes que podem ser em qualquer forma, por exemple, liofilizada, cu em solução ipor exemplo, uma água destilada ou solução tampor.acia i , ecc.
Em um. aspecto preferido da presente invenção, e fornecido um estojo que compreende um conjunto de sondas a- qui descritas, um arranjo e cpcicnaimente um ou miais marca- vj. uo J_ ti S .
Ij ITi COH Ί üntO Οβ inSLrüÇwGS L dlIRO ΘΓΤί í. j_p_LCdÍ4.itiíi Lc incluidc.
Usos Vantajosamente, a presente invenção pode ser usada a fim de obter informação a cerca da organização espacial de seqüência de nucleotídeos - tais como loci genômicos in vi- tro ou in vivo. A título de exemplo, a tecnologia 4C pode ser usa- da para estudar a organização tridimensional de um ou mais loci do gene. De maneira particular, esta tecnologia pode ser usada para estudar o papel de um ou mais fatores de transcrição na organização tridimensional de um ou mais loci do gene. A título de exemplo adicional, a tecnologia 4C po- de ser usada para estudar o papel de fatores de elementos de DNA trans-atuantes e cis-reguladores. A título de exemple adicional, a tecnologia 4C po- de ser usada para estudar regulamento gene de lcngo alcance in vitro ou in vivo. A título de exemple adicional, a tecnologia 4C po- de ser usada para estudar proximidade e interação infra cro- mossoma 1 . A título de exemplo adicionai, a tecnologia 4C pc- de ser rsacia ra ra prcvim·; da de e intcraçcc ir.t-r cremessoma 1 . A r -iulo de 0xsmc.i.c aoicrcna*, a tecnCiC^iâ 4_ po — de ser usada para identificar sequências de nuclectíaecs que funcicnair. cem um prometer, intensificador, silenciador, ’ «c- . ame, regí co· ee 'λγρ.role oe _scus, cr _ gem d<c r j.^~a v<= ~, MAR, SAR, centrcmero, telômerc ou qualquer outra seqüência de interesse em uma rede regulatória. A titulo de exemplo adicional, a tecnologia 4C po- de ser usada para identificar genes responsáveis por um fe- nótipo (doença) em casos onde acontece de uma mutação e/ou deleção afetar um elemento regulador distante e seu mapea- mento portanto não consegue fornecer tal informação. A título de exemplo adicional, a tecnologia 4C po- de ser usada para reconstruir eventualmente a conformação espacial de loci do gene, grandes regiões genômicas ou mesmo cromossomos completos. A título de exemplo adicional, a tecnologia 4C po- de ser usada para definir sequências âncora potenciais que sustenta certos cromossomos juntos no espaço nuclear. A título de exemplo adicional, a tecnologia 4C po- de ser usada para reconstruir eventuairr.er.te c posicionamento des cromossomos em alta resolução uns com relação acs ou- tros. A. titule de exemplo adicionai., a tecnologia 4C pe- de ser usada em diagnóstico (por exemplo, diagnóstico pré- natal) para detectar ou identificar ré-arranjes ger.cmíccs e/cu aberrações - tais como translocações, deieçces, inver- Técnicas gerais de metcdolcqia de dna reccmbinante A presente invenção emprega, a menos que de outra forma indicada, técnicas convencionais de química, biologia '·_■ ξ _ α w J.è tx o, w· i_ -J. _ _ w a. od[,a^_uaJt: J, tf J.2'i VcISdClC IΪ d t cJ 12C C 3 ü_ — a. Tais técnicas são explicadas na literatura. Ver, per e- xemplo, J. Sambrook, E. F. Fritsch, and T. Maniatis, 1989, Molecular cloning: A Laboratory Manual, Second Edition, Bo- oks 1-3, Cold Spring Harbor Laboratory Press; Ausubel, F. M. et at. (1995 and poriodic supplements; Current Protocols in Molecular Biology, ch. 9, 13, and 16, rahn Wiley & Sons, New York, N.Y.); B. Roe, J. Crabtree, e A. Kahn, 1996, DNA Iso- latíon and Sequencing: Essential Technics, John Wiley &
Sons; M. J, Gait {Editor), 1984, Oligonucleotide Synthesis: A Practical approach, Irl Press; and, D. M. J. Lilley and J. E. Dahlberg, 1992, Methods of Enzymology: DNA Structure Part A: Synthesis and Physical Analysis of DNA Methods in Enzy- mology, Academic Press. Cada um desses textos gerais é aqui incorporado pela referência. A invenção será agora adicionalmente descrita a título de exemplo, que deve servir para ajudar versados na tecnologia realizar a invenção e não devem ser de maneira nenhuma para limitar o escopo da invenção.
Exemplo 1 Materiais & Métodos Tecnologia 4C
As etapas iniciais dc procedimento da tecnologia 3C foram realizadas da maneira previamente descrita (Splin- ter at al. (2004). Methods Enzymol 375, 493-507 (2004), pro- duzindo produtos de ligação entre fragmentos HindIII. Este padrão 3C ligado a HindIII (-50 pg) foi digerido toda a noi- te a 100 ng/pL com 50 U de uma enzima de restrição de corte freqüente secundária, sendo tanto Dpnll (HS2, Rad23A) quanto NlalII (β principal). Para evitar restrições em formação de circulo de DNA (Rippe at al. (1995) Trends Biochem Sei 20, 500-6) , foi tomado cuidado para escolher uma enzima de res- trição secundária que não corte dentro de cerca de 350-400 bp do sitio de restrição HindIII que demarca o fragmento de restrição de interesse (isto é, o 'bait'). Após a digestão da enzima de restrição secundária, DNA foi fenol extraído, etanol precipitado e subsequentemente ligado a baixa concen- tração (amostra de 50 pg em 14 mL usando 200 U ligase (Ro- che) , 4 horas a 16 °C) para promover Dpnll ou formação de círculo Dpnll. Produtos de ligação foram fenol extraído e etanol precipitado, usando glicogeno (Roche) como um veículo (20 pg/mL). Os círculos de interesse foram linearizados di- gerindo toda a noite com um 50 U de uma enzima de restrição terciária que corta o bait entre o sítio de reconhecimento de enzima de restrição primária e secundária, usando as se- guintes enzimas de restrição: Spel (HS2), PstI (Rad23A) e Pflml (β principal). Esta etapa de linearização foi realiza- da para facilitar hibridização subseqüente do iniciador du- rante a primeira rodada de amplificação de PCR. Produtos di- geridos foram purificados usando uma coluna de remoção de nucleotídeos (250) QIAcquick (Qiagen).
Reações de PCR foram realizadas usando o sistema PCR de Expand Long Template (Roche), usando condições cuida- dosamente otimizadas para assegurar amplificação linear de fragmentos medidos em até 1,2 kb (80 % de fragmentos de PCR 4C são menores que 600 bp) . Condições do PCR foram como a seguir: 94 °C por 2 minutos, 30 ciclos de 94 °C por 15 se- gundos, 55 °C por 1 minuto e 68 °C por 3 minutos, seguido por uma etapa final de 68 °C por 7 minutos. A quantidade má- xima de padrão que ainda apresenta faixa linear de amplifi- cação foi determinada. Para isto, diluições seriais de pa- drão foram adicionadas às reações de PCR, material do DNA
amplificado foi corrido em um gel de agarose e produtos PCR foram quantificados usando software ImageQuant. Tipicamente, 100-200 ng de padrão por 50 pL da reação de PCR deu produtos na faixa linear de amplificação. 16 a 32 reações de PCR fo- ram agrupadas e purificaram este padrão 4C usando o sistema de remoção de nucleotideos QIAquick (250) (Qiagen). Padrão 4C purificado foi marcado e hibridizado com arranjos de a- cordo com padrão dos protocolos ChIP-chip (Nimblegen Systems of Iceland, LLC). DNA genômico diferencialmente marcado que foi digerido com a enzima primária e secundária usado no procedimento 4C, serviu como um padrão de controle para cor- rigir as diferenças nas eficiências de hibridização. Para cada experimento duas amostras independentemente processadas foram marcadas com orientações de corante alternados.
Seqüências de iniciadores 4C usadas: HS2:5'- ACTTCCTACACATTAACGAGCC-3', 5'- GCTGTTATCCCTTTCTCTTCTAC-3' Rad23A:5'- TCACACGCGAAGTAGGCC-3'f 5'- CCTTCCTCCACCATGATGA-3' β principal:5' -AACGCATTTGCTCAATCAACTACTG-3', 5' - GTTGCTCCTCACAITTTGCTTCTGAC-3' Arranjos 4C
Arranjos e análise foram baseados em m34 construí- dos por NCBI. Sondas (60-mer) foram selecionadas das seqüên- cias 100 bp à montante - e à jusante dos sítios HindIII. O teor de CG foi otimizado em 50 %, para sinais de hibridiza- ção uniformes. Para prevenir hibridização cruzada sondas que tiveram qualquer similaridade com repetições altamente abun- dantes (RepBase 10,09) foram removidas do conjunto de sonda.
Além do mais, sondas que deram mais que dois bons êxitos de BLAST no genoma foram também removidas do conjunto de sonda.
Alinhamentos de seqüência foram realizados usando MegaBLAST (Zhang et at. (2000) J Comput Biol 7, 203-14) usando a con- figuração padrão. Um bom êxito definido como um alinhamento de 30 nt ou mais.
Análise de dados 4C A razão de sinal amostra-4C/genômico DNA foi cal- culado para cada sonda e os dados foram visualizados com software SignalMap fornecido por Nimblegen Systems. Dados foram analisados usando o pacote R (http://www.r-project. orq), Spotfire and ExceL. Razões de hibridização não proces- sada apresentou agrupamentos de 20-50 sinais 4C positivos junto com o padrão do cromossomo. Para definir estes agrupa- mentos, foi aplicada uma média corrida. Vários tamanhos de janela foram usados, variando de 9-39 sondas, dos quais to- das identificaram os mesmos agrupamentos. Os resultados a- presentados foram baseados em um tamanho de janela de 29 sondas (em média 60 kb) e foram comparados com a média cor- rida realizada em dados randomizados. Isto foi feito para cada arranjo separadamente. Conseqüentemente, todas as medi- ções foram apreciadas com relação a amplitude e ruído para esse arranjo específico. A Taxa de falsa descoberta (FDR), definida como (número positivas falsos) / (número de positi- vos falsos + número de positivos verdadeiros) foi determina- da como a seguir: (número de positivos no conjunto randomi- zado) / (número de positivos nos dados). O nível do patamar foi determinado usando uma abordagem de cima para baixo para o valor mínimo estabelecido para o qual: FDR<0,05.
Em seguida, experimentos biológicos duplicados fo- ram comparados. Janelas que atenderam o patamar em ambas du- plicatas foram consideradas positivas. Comparando dados ran- domizados, nenhuma janela ficou acima do patamar em ambas duplicatas. Janelas positivas diretamente adjacentes ao pa- drão do cromossomo foram ligadas (não é permitida nenhuma folga), criando áreas positivas.
Análise de expressão Para cada tecido, três microarranjos independentes foram realizados de acordo com o protocolo Affymetrix (ca- mundongo 430 - 2 arranjos). Dados foram normalizados usando RMA ca-tools; www.bioconductor.org) e para cada conjunto de sonda foi calculada a média das medições dos três microar- ran jos. Além do mais, quando múltiplos conjuntos de sonda -y £2, rpe^TV*· y" -"X "íTl fCí C? ^ Γ~ι £~~‘ r~i £"S "f" ^ 1 '11 ^ f"· β τη ■'"» fU ^ ^ 3. CÍ d Cl CC O ci 1 ,~I .v,CSjC5j.Cí , f-l *__j· >C 2Γ ·3. C j- I 'λ'λ λ , C - v ■- ^ ÍiC J w í, v I ι ^ Ty , j_ ·_^ ·—»d x-' ra estabelecer carpes cails "presente", "ausente" e "margi- nal". Genes com um campo call "presente" em tedes cs três arrancos e um vai cr de expressa" maior ove 51 foram da""m:- r.adcs expresso. "Ger.es especif iccs dc Fígado fetal" fcrait classificadcs ccmc genes que atenderam nossos critérios de ser expresso em fígado fetal e tiveram valores de expressão mais que cinco vezes superiores comparados com cérebro fe- tal. Para fornecer uma medida de atividade transcrícional geral em torno de cada gene, foi aplicada uma soma corrida.
Para isto, nós usamos valores de expressão log- transf orraados. For cada gene nós calculamos a soma da ex- pressão de todos genes encontrados em uma janela 100 kb á montante do início e 100 kb à jusante da extremidade do ge- ne, incluindo o próprio gene. Valores resultantes para genes ativos encontrados nas regiões 4C positivas {n = 124, 123 e 208 respectivamente para HS2 em fígado, Rad23A em cérebro e Rad23A em fígado) foram comparados com os valores obtido pa- ra genes atives fora áreas 4C positivas (n = 153, 301 e 186, respectivamente, onde n = 153 corresponde ao número de genes não interagentes atives, presentes entre a região mais inte- ragente centrcmérica e o teiemere do crcmcsscmc 7) ; cs dois grupos foram comparados usando um teste Wiiccxcn de soma de poços unilaterais.
Sondas FISH
Os clones EAC seguintes (BACPAC Resources Centre) feram usado; RP23-370E12 para Hbb-1, SP23-317H16 para chr.7 ^ ^ ^ ^ -r-. ^ '· _ ~J 'J ./1 Q -s τ,-, Γ’ν~ ·"· .Τ' ^ " ' — ' “* ΐ} ^ ^ ·ί“ ^ ‘ ” 'ί ■“'*■“ 1 t “ J ~ ^ ^ RP23-32C19 para chr.7 a 113,3 Mb, RF23-143F10 para ohr.7 a i 30, j. r RFr3 —4;wNt para cr.r. ■ a 3, j. .ab, ___ para hr. 7 a 135,0 Mb bu agrupamento de gene:, RP23-136A15 cara Rad?3A, RP23-307P24 para chr.5 ar. 21, B Mb a RP23-46CF2! para crcmcsscmo 7 nós usamos clone PI 5279 (Gencme Ststens Inc.; que anela no segmento de DNA D7Mit21. Sondas marcadas de primo aleatório foram preparadas usando BioPrime Array CGH genomic Labeling System (Invitrogeno) . Antes da marcação, DNA foi digerido com Dpnll e purificado com um conjunto de DNA limpo e concentrador 5 (pesquisa Zymo)- DNA digerido (300 ng) foi marcado com SpectrumGreen dUTP (Vysis) ou flúor Alexa 594 dUTP (sondas Moleculares) e purificado por meio um estojo de purificação de GFX PCR DNA e Gel Band (Amersham Biosciences) para remover nucleotideos não incorporados. Es- pecificidade de sondas marcadas foi testada em esfregaços de metáfase preparado de células ES murina.
Crio-FISH
Crio-FISH foi realizado da maneira descrita ante- ricrmente 5. Resumidamente, fígado E14.5 e cérebro foram fi- xados por 20 minutes em 4 % de paraformaldeído/HEPES250 mM, pH 7,5 e cortados em pequenos blocos de tecido, seguido per uma outra etapa de fixação de 2 horas em 8 % de paraformal- deído a 4 °C. Blocos de tecido fixado foram imersos em 2,3 M de sacarose por 20 minutos a temperatura ambiente, montados em um suporte de corpo de prova e congelados rapidamente em nitrogênio liquido. Blocos de tecido foram armazenados em tlâtirã Re âprCXÍrr.3 dâlT.enCS 2CC I1ITL f C TcilTl CCrtlaòâS US 3.Γ.Ο.Ο \ui.l R S i C X θ Γ U J _ X Γ d ΓΓ. 1 CIT C U C~’6 r ^ ô Cj U 2 p 5 d O C C ΓΓ. C Γ 1 C — ^ C 6 S i C Γ _ O — — — — ca; . Usar.dc um laço cheio ccm sacarcse, seções :cra.T, trans- feridas para a larr.í nula e armazenadas a ~s 0 ~ *"■ - h - a - --2. ^ s -■ aT_adas c z u j_ zi u oura i ~ r. v^“ ^ -*--^ ■— -J- ·- - “ — - ■- tramadas cc-m 250 ng/mL de RNase em 2 x SSC por 1 hora a 3 ■' °C, incubadas por 10 minutos em 0,1 M de HCL, desidratadas em uma série de etanol e desnaturadas por 8 minutos a 80 °C em 70 % de formamida/2 x SSC, pH 7,5. Seções foram novamente desidratadas diretamente antes da hibridização da sonda. 500 ng de sonda marcada foi co-precipitada com 5 pg de DNA de camundongo Cotl (Invitrogeno) e dissolvida em hybmix (50 % de formamida, 10 % de sulfato dextrano, 2 x SSC, 50 mM de tampão de fosfato, pH 7,5). Sondas foram desnaturadas por 5 minutos a 95 °C, ré-aneladas por 30 minutos a 37 °C e hibri- dizadas por pelo menos 40 horas a 37 °C. Após lavagem pós- hibridização, núcleos foram contramanchados com 20 ng/mL DA- PI (Sigma) em PBS/0,05 % Tween-20 e montados em reagente an- tidesbotamento Prclong Gold (Sondas Moleculares).
Imagens foram coletadas ccm um microscópio de epi- flucrescêr.cia Zeiss Axic Imageador ZI (x ICO plan apochro- mat, 1,4 oil objeativc), equipado ccm uma câmera CCD e soft- ware Isis FISH Imaging System (Metasystems; . Um mínimo de 250 β-gicbinas cu areies Rad23A roí analisado e pontuado ce- rno sobreposição ou não sobreposição ccm BACs localizados em ouiro lugar no genema, por uma pessea que não conhece a com- binação da sonda aplicada às seções. Testes de ajuste em re- plicata (estatística G) 6 foram realizados para avaliar sig- nificância de diferenças entre valores medidos para regiões positivas 4C contra negativas 4C. Revisão geral do resultado é fornecida na Tabela 2.
Embora tenhamos encontrado diferenças estatistica- mente significativas entre freqüências de interação de fundo (0,4-3,9 %) e reais (5-20,4 %), pode ficar claro que fre- qüências medidas por crio-FISH são menores que as medidas por outros usando protocolos FISH diferentes. O seccionamen- to pode separar alguns loci de interação e medições crio- FISH subestimarão ligeiramente portanto as verdadeiras fre- qüências de interação. Por outro lado, procedimentos atuais 2D- e 3D FISH sobrestimarão estas porcentagens por causa da resolução limitada na direção z. No futuro, técnicas de mi- croscopia melhoradas em combinação com sondas FISH mais es- pecíficas revelarão melhores freqüências de interação verda- deiras .
Exemplo 2 O procedimento 3C (isto é, fixação de formaldeído, (primária) digestão de enzima de restrição, re-ligação de fragmentos de DNA reticulados e purificação de DNA) é reali- zado essencialmente como descrito (Splinter et at., (2004) Methods Enzymol. 375: 493-507), produzindo uma mistura de DNA ('padrão 3C') contendo fragmentos de restrição que são ligados em virtude de eles estarem originalmente perto do espaço nuclear. PCR inverso é realizada para amplificar todos os fragmentos ligados a um dado fragmento de restrição ('bait'; escolhido em virtude de ele conter um promotor, intensifica- dor, isolante, região de anexação de matriz, origem de re- plicação ou qualquer outra primeira (visada) seqüência de nucleotideos).
Para isto, círculos de DNA são criados digerindo o padrão 3C com uma enzima de restrição secundária (preferi- velmente, um cortador freqüente reconhecendo seqüências de tetra- ou penta-nucleotídeos), seguido por ligação em condi- ções diluídas de maneira que interações intra-moleculares sejam favorecidas. Para minimizar uma propensão à formação de círculo por causa das restrições topológicas (Rippe et al, (2001) Trends in Biochem. Sciences 26, 733-40), deve ser escolhida uma enzima de restrição secundária que corta pre- ferivelmente o bait a X350-400 bp do sítio de restrição pri- mária. Para aumentar a eficiência e reprodutibilidade de am- plificação de PCR inversa, círculos são mais bem lineariza- dos antes da amplificação de PCR por uma enzima de restrição (por exemplo, um cortador de 6 ou mais bp) que corta o bait entre o sítio de restrição primário e secundária de diagnós- tico .
Digestão do padrão 3C com a enzima de restrição secundária, circularização por meio de ligação em condições diluídas e linearização de círculos contendo bait são rea- lizados sob condições padrão para tais manipulações de DNA produzir um padrão de DNA para amplificação de PCR inverso ( 'padrão 4C' ) .
Desta maneira, 10 pg de padrão 3C são digeridos em 100 pL com 20 U da enzima de restrição secundária (por toda a noite), seguido por inativação de calor da enzima e purificação do DNA. Ligação é realizada em 10 mL. (1 ng/pL DNA) com 50 U T4 ligase (4 horas a 16 °C, 30 minutos a RT) , seguido por purificação de DNA. Finalmente, a linearização dos círculos de interesse é feita em 100 pL com 20 U de en- zima de restrição (por toda a noite), seguido novamente por purificação de DNA.
Para PCR inversa, dois iniciadores específicos bait são projetados, cada qual o mais próximo possível do sítio de reconhecimento de enzima de restrição primária e secundária diretamente vizinha, respectivamente, e cada qual com sua extremidade 3' voltada para fora para que a extensão se dê imediatamente nos sítios de restrição em um fragmento ligado ao bait. PCR inversa com estes iniciadores é preferi- velmente realizado em 100-400 ng do DNA de padrão 4C (por 50 pL da reação da mistura de PCR), para incluir um número má- ximo de eventos de ligação por reação de PCR. Nós realizamos PCR inversa aplicando o Sistema PCR de Padrão Expand Long (Roche), usando tampão 1 de acordo com procedimentos do fa- bricante . São realizados os ciclos de PCR seguintes: 1. 2 minutos 94 °C
2. 15 segundos 94 °C
3. 1 minuto 55 °C
4. 3 minutos 68 °C 5. etapa repetida 2-4 29 x (ou nada entre 25-40 x) 6. 7 minutos 68 °C 7. fim.
Gel eletroforese é realizado para analisar repro- dutibilidade entre reações de PCR individuais. Tipicamente, parceiros produtos idênticos devem ser obtidos. A fim de obter material suficiente para marcar por iniciação aleatória e hibridização do arranjo, múltiplas re- ações de PCR (cada obtida após 30 ciclos de PCR) podem ser agrupadas, (em vez de aumentar o número de ciclos de PCR por reação). Como uma alternativa para marcação com primo alea- tório, nucleotideos marcados podem ser incorporados nos úl- timos ciclos de PCR (por exemplo, 30 ciclos (sem marcação) + 10 ciclos (marcação)).
Exemplo 3 Detecção de translocação usando tecnologia 4C
Tecnologia 4C é usada para medir as freqüências da interação para a dada seqüência X presente em um dado cro- mossomo A em células de um sujeito saudável e em células de um paciente que carrega uma única translocação reciproco, entre cromossomo A e B com o ponto de ruptura perto da se- qüência X (apresentado na Figura 9).
Em células normais, esta análise revela sinais de elevada hibridização (isto é, interações freqüentes com X) para (quase) toda sonda localizada em 0,2-10 Mb da seqüência X em cromossomo A (o tamanho atual da região cromossomal mostrando fortes sinais de reticulação depende na maioria das vezes da complexidade da amostra que foi hibridizada com o arranjo). Em outro lugar no mesmo cromossomo A, bem como em outros cromossomos, não é observada nenhuma região gran- de como esta (no padrão linear de DNA) de sondas com eleva- Em células de paciente, entretanto, sinais de hi- bridização com medas as sondas do cromossomo A localizadas nc outro lade dc ponto de ruptura são reduzidas para -5C % 'um.a ccoía do tcromcssomo A é ai r.da ir.ta~^a e produz-: si- ein células normais) concentração de sinais de elevada hibri- dização é observada para sondas vizinhas do ponto de ruptura em cromossomo B. De fato, a transição abrupta entre sondas mostrando no contra sinais de hibridização fortes em cromos- somo B revela a localização do ponto de ruptura em cromosso- mo B.
Exemplo 4 Resultado de análise de tecnologia 4C
Tecnologia 4C foi usada para caracterizar o ambi- ente genômico da região de controle do locus β-globina do camundongo (LCR), focado em um fragmento de restrição con- tendo seu sitio 2 hipersensivel (HS2). O LCR é um forte ele- mento regulador de transcrição específico de eritróide re- querido para altos níveis de expressão do gene β-globina. 0 locus β-globina está presente em cromossomo 7 na posição 97 Mb, ende ele reside em um grande agrupamento 2,9 Mb, de ge- nes do receptor olfativo que são transcritos somente em neu- rônios olfativos. Interações foram analisadas em dois teci- dos: fígado fetal E14.5, ende o LCR é ativo e cs genes β- glcbina são altamente transcritos, e cérebro fetal E14.5, ende o LCR é inativo e o genes glebina são silenciosos. Em ambos tecidos, a grande maioria de interações foi encontrada com seqüências em cromossomo 7 e muito poucas interações LCR foram detectadas com seis cromossomos não relacionados (8, 10, 11, 12, 13, 14) (Figura 13a). Os sinais mais fortes em cromossomo 7 foram encontrados em uma região 5-10 Mb centra- lizados em torno da posição cromossomal de β-globina, de a- cordo com a idéia de que freqüências da interação são inver- samente proporcionais à distância (em pares de base) entre seqüências de DNA fisicamente ligadas. Não foi possível in- terpretar quantitativamente as interações nesta região. Nós inferimos que estas seqüências próximas foram juntamente com β-globina tão freqüentes que sua grande sobre-representação em nossas amostras de hibridização saturaram as sondas cor- respondente. Isto foi confirmado quando nós realizamos hi- bridização com amostras diluídas 1 : 10 e 1 : 100 e observa- mos que a intensidade do sinal foi reduzida em sondas fora e na borda, mas não nesta região (dados não apresentados). O procedimento 4C forneceu dados altamente repro- dutíveis. A figura 2b-c apresenta razões não processadas de sinais 4C com relação a sinais de hibridização de controle para duas regiões em cromossomo 7 1,5 Mb, grosseiramente 25 Mb e 80 Mb fora do gene β-globina. Neste nivel de resolução, os resultados das amostras independentemente processadas fo- ram quase idênticos. Tanto em fígado fetal quanto em cére- bro, agrupamentos de sinais positivos foram identificados em cromossomo 7, freqüentemente em locais cromossomais dezenas de megabases fora de β-globina. Estes agrupamentos tipica- mente consistem em minimamente 20-50 sondas com maiores ra- zões de sinal justapostos no padrão do cromossomo (Figura 13c-c' . Dada =:---1=1 - = ; e arrar.j c urr. ovcr..c d-_ li^-· ção independente. Além. dc rr.a 1 s, somente ciuas cópias cie frag- mente de restrição -32 estão presentes per céiuia, caaa uma das quais pede scr.er.te ligar cerr. um cutrc fragmento de res- trição. Portanto, a detecção de eventos de ligação indecen- q’pp p q p oer. '“z ^ i”_S "u ^ ΓΓ. θ Γ. Γ ? 3Í 3 3 3 3. 3 3 C 3 3 - , ._j. _ cart fortemente que o iceus correspondente faz contato ccm o LCR de β-globina em múltiplas células.
Para determinar a significância estatística destes agrupamentos, dados de experimentos individuais foram orde- nados em mapas cromossomais e analisados usando um algoritmo de média corrida com um tamanho de janela de aproximadamente 60 kb. A distribuição da média corrida de dados misturados aleatoriamente foi usada para estabelecer um valor de limi- te, permitindo uma falsa taxa de descoberta de 5 %. Esta a- nálise identificou 66 agrupamentos em fígado fetal e 45 em cérebro que foram encontrados reprodutíveis em experimentos em duplicata (Figura. 13d-f). De fato, alta resolução FISH confirmou que tais agrupamentos verdadeiramente representam loci que interagem frequentemente (ver a seguir).
Assim, a tecnologia 4C identifica loci de intera- ção de longo alcance pela detecção de eventos de ligação in- dependentes com múltiplos fragmentes de restrição agrupados em uma pcsiçãc crcmcsscmal.
Uma série de experimentos 4C completam,ente inde- pendentes for realizada ccm um conjunto de iniciadcres de PCR inversa diferente que investigou o ambiente genômico dc gene β principal, localizado -50 kb à jusante de HS2 . Fm um frequentemente recebe contato do LCR. Agrupamentos de inte- rações de longo alcance quase idênticos ccm β principal ccrr.c com ΗΞ2 foram encontrados, tanto em. fígado fetal quanto em cérebro, substar.ci ar.de adio· ~nairente oue estes ’ f a cep Exemplo 5 0 Iccus β-globina ativo e inativo ocupa ambiente genômico distinto.
Uma Comparação entre o dois tecidos revelou que o locus β-globina ativamente transcrito em figado fetal inte- rage com um conjunto de loci completamente diferente de sua contraparte transcricionalmente silenciosa em cérebro (τ=0,03; Correlação de Spearman's Rank) (Figura 13f) . Isto exclui que resultados sejam influenciados pela composição de seqüência das sondas. Em figado fetal, os segmentos do DNA de interação foram localizados em uma região 70 Mb centrali- zada em torno do locus β-globina, com a maioria (40/66) lo- calizada em direção ao telcmero do cromossomo 7. Em fetal cérebro, loci de interação foram encontrados em similares ou mesmo grandes distâncias de β-glcbina comparados ao figado fetal e com a grande maicria de interações (43/45) localiza- da em direção ac centrcmero do cromossomo 7. Estes dados de- monstraram que o iccus p-g^-obina ativo e inativo faz contato ccm diferentes partes do cromossomo 7.
Seis outros cromossomos (8, 10, 11, 12, 13 e 14) fcram representados ncs microarranjos. Sinais fortes de hi- bridização nestes cromossomos foram raros, aparecem típica- mente isolados no padrão de DNA linear e freqüentemente fo- ram ausentes dos experimentos em duplicata. Também, niveis de média corrida através destes cromossomos nunca chegaram perto reprodutivelmente dos niveis pontuados para cromossomo 7 (Figura 19). Assim, outros dados mostraram que o locus β- globina basicamente faz contato com os loci em outro lugar no mesmo cromossomo, de acordo com a localização preferida deste locus dentro de seu próprio território do cromossomo. Nós notamos que o locus β-globina foi também presente no ar- ranjo (cromossomo 11) e não pontuou positivo para interação com β-globina, de acordo com a demonstração recente por FISH que camundongo oí e β-globina não se encontraram freqüente- mente no espaço nuclear (Brown, J. M et at. (2006) J Cell Mal 172, 177-87). A fim de um melhor entendimento da relevância das interações de longo alcance observadas no cromossomo 7, nós comparamos os loci de interação com as posições cromossomais de genes. Além do mais, análise de arranjo de expressão Affymetrix foi realizada para determinar atividade de trans- crição nestas posições nos dois tecidos. Embora o tamanho médio de áreas de interação em fígado fetal e cérebro seja comparável (183 kb e 159 kb, respectivamente), diferenças drásticas foram observadss em seu teor e atividade de gene.
Em fígado fetal, 80 % dos loci de interação de β-globina contiveram um ou mais genes ativamente transcritos, ao passo que em cérebro fetal a grande maioria (87 %) não demonstrou atividade de gene detectável (Figura 15). Assim, o locus β- globina é incorporado em um ambiente genômico muito diferen- ele primeiramente faz contato oom os loci transcricionais silenciosos localizados em direção ao centrcmerc do oremes- sexo 7. £m figado fetal, cr.de c locus é altamente ative, ele interaae creferer.oialxente com regiões ax ivame^te tr:5rscri - tas localizadas mais proemonentomente em direção ac .azo te- Icmérico do crcmcssomo 7. Impcrtantemente, tecnologia 4C i- dentificou ambos Uros e Eraf, {~30 Mb distante de β-globina) como genes interagindo com o locus β-globina em fígado fe- tal, de acordo com observações prévias feitas por FISH (Os- borne, C. S. et at. (2004) Nat Genet 36, 1065-71 (2004) ) .
Interessantemente, em cérebro em contatos foram observados com dois outros agrupamentos do gene receptor olfativo pre- sente em cromossomo 7 que foram localizados a cada lado de β-globina, e 17 e 37 Mb distante dela.
Nem todas regiões transcritas em cromossomo 7 in- teragem com o locus β-globina ativo em fígado fetal. Portan- to, nós pesquisamos denominador que compartilha exclusiva- mente pelo loci de interação mas não por outras regiões ati- vas em fígado fetal. Cs genes β-globina, Uros e Eraf são to- dos genes específicos de eritreide que pedem ser regulados pelo mesmo conjunto de fatores de transcrição, e é uma idéia atrativa que esses fatores coordenam expressão de seus genes visados r.c espaço nuclear. Nós ccmparadcs dados arranjes de expressão Affymetrix de fígado fetal E14.5 com o de cérebro fetal para identificar genes preferencialmente expressos (>5 vezes mais) em fígado fetal. Foram classificados 23 % des genes ativos como estes em cromossomo 7 como "fígado fetal Q — 1 O C d 11 1 U da . AGSirG, nos r.âo sr.ccr.t rair.CS nenhum 0ΓιΓΙί3ΰΕυί mento de genes de "fígado fetal especííico" nas áreas cc- Iccaiizadas. Mais impcrtantemente, 4 9 de 66 C7 4 6) regiões de i rteracãc não nor.f i r.ham. um "fixado f et 31 - especí f imm" e cia para expressão coordenada de genes específicos do tecido no espaço nuclear. Cs genes β-glcbina são transcritos em ta- xas excepcionalmente altas e questionou-se em seguida se o locus preferencialmente interage ccm outras regiões de ati- vidade transcricional alta, sendo tanto genes altamente ex- pressos quanto áreas com uma alta densidade de genes ativos.
Usando contas Affymetrix como uma medida para atividade do gene, nós realizamos um algoritmo de soma de corrida para medir diversas atividades transcricionais nas regiões 200 kb em torno dos genes ativamente transcritos. Esta análise re- velou que atividade transcricional em torno genes de intera- ção não foi maior que em torno de genes de não de interação ativos em cromossomo 7 (p = 0, 9867; Wilcoxon Rank sum) .
Exemplo 6 O ambiente genômico de um gene zelador é amplamen- te conservado entre cs tecidos Em seguida, foi investigado se um gene que é simi- larmente expresso em ambcs tecidos também muda seu ambiente genômico. Rad23A é um gene ubiqüítariamente expresso que re- side em um denso agrupamento de genes basicamente de genes zeladores em cromossomo 8. Tanto em rígadc fetal E14.5 quan- to em cérebro, este gene e muitos de seus vizinhos diretos Q.qn vrí in n 1 · cp Λ,·^ - I. Z3.H3. ^ 1 dCr.tl t 1 ^- U ...Ul wJC interações de Icngc alcance ccm .oc; cie até .· ^ -v-c dis^an^e de Rad23A. Importar, temer.ce, interações ccrr, Rad23A foram a~- '■a^eni-e ~ c- r r e 1 a c i c r. u d a s er.tre flcadc z etal e cerecro .. x — 0,13; correção de Spearmar. s Rar.k · · Figura ira' . "ca = genes ativamente transcritos. Assim, em ambos tecidos grcs- seiramente 70 % contiveram pelo menos um gene ativo (Figura 15b-c). Regiões em torno de genes de interação revelam ní- veis mais altos estatisticamente significativos de atividade do gene comparados com genes ativos em outro lugar no cro- mossomo, como determinado por um algoritmo de soma de corri- da (p < 0,001 para ambos tecidos}. Assim, diferente do locus β-globina, o gene Rad23A que é localizado em uma região rica em gene preferencialmente interage em distância com outras regiões cromossomais de maior atividade transcricional. Foi observado por FISH que a área cromosscmal contendo Rad23A reside basicamente na borda de (90 %) ou fora (10 %) de seu território do cromossomo (não publicado, D. Noordermeer, M.
Branco, A. Pombo and W. de Laat) . Entretanto, a análise 4C revelou somente interações infra-romossomais e nenhuma área no cromossomo 7, 10, 11, 12, 13 ou 14 reprodutível atendeu nossos rigorosos critérios para interação. Assim, Rad23A e basicamente envolvido em interações intracrcmossomais que são similares em dois tecidos muito diferentes. Se Kad2uA tiver icci vizinhos preferidos nestes cromossomos não rela- cionados, eles não interagem frequentemente c bastante para ser detectados nas condições aqui usadas para a tecnologia Exemplo 1 Validação de zecoologia 1C per micrcscopia ae alta resolução Para validar o resultado obcído pela tecnologia 4 o r exr°r: ''ric-ETSH "■''ram realizados. Cr~c-_-SrÍ a uma técnica de uicrcsccDia recentemente desenvolvida, que tem a vantagem sobre protocolos 3D-FISH atuais, que preserva me- lhor a ultra-estrutura nuclear oferecendo, portanto, melhor resolução no eixo-z pela preparação de crio-seções ultrafi- nas (Branco, M. R. . & Pombo, A (2006) . PLoS Blol 4, el38) .
Dados de 4C foram verificados medindo agora β-globina fre- quente ou alelos Rad23A (sempre n>250) co-localizados com mais que 15 regiões cromossomais selecionadas em seções ul- trafinas de 200 nm preparadas de fígado e cérebro E14.5. Im- portantemente, todas as frequências da interação medidas por crio-PISH estavam em perfeito acordo com o resultado 4C (Fi- gura 17). Por exemplo, regiões distantes que foram identifi- cadas para interagir com β-globina pela tecnologia 4C co- localizada mais freqüentemente do que as áreas intervenien- tes não detectadas per 4C (7,4 % e 9,7 %, contra 3,6 % e 3,5 I, respectivamente). Também, os dois agrupamentos dc recep- tor de gene olfativo distantes identificados pela tecnologia 4C para interagir com β-gicbina em cérebro fetal, mas não em frequências de colocalízação pontuadas no fígado respectiva- mente de 12,9 % e 7 % em cérebro, contra 3,6 % e 1,9 % em seções dc fígado. Em resumo, frequências de colocaiização medidas por loci positivamente identificados pela tecnologia 4C foram r.cdas s : 7·": f icativamente ma = -;·■·= = ■= fra qvêr.r: = s medidas oelos loci de fundo G . Nós concluímos que tecnolo- gia 4C identifica verdadeiramente icci de interação de GNG.
Fir.alir.er.te, nós usamos cri c-FISH para demonstrar que icci identificados interagindo ccn β-qlobina também fazem contato - r CLm;ppr p - ] ^ <d ·"■* r'' ^ c; " 12Γ ^ ^ S T 0 Z. C 1 .Θ Z 3 21.5 1 Γ 0' C 2 Tg duas regiões ativas separadas por grande distância cromosso- ma 1 em fígado fetal (Figura 19) bem como para dois agrupa- mentos de gene 0R inativos separados longe um do outro no cromossomo em cérebro (Figura 17). Interessantemente, fre- qíientes contatos entre estes dois agrupamentos de gene 0R distantes foram também encontrados em fígado fetal, onde e- les não interagirão com o agrupamento de gene 0R que contém o locus β-globina ativamente transcrito. Estes dados indicam que interações nucleares entre agrupamentos de gene OR dis- tintos não foram uma peculiaridade do tecido do cérebro fe- tal analisado. Tentando especular que tais contatos espaci- ais facilitam a comunicação entre os muitos genes OR neces- sários para assegurar que é transcrito somente um alelo sim- ples por neurônio olfativo (Shykind, B. (2005) Hum Mol Genet 14 Spec No 1, R33-9.
Exemplo 8 Organização nuclear de domínios de cromatina ati- vos e inativos As observações aqui descritas demonstram que não somente regiões gencmicas ativas, mas também inativas, for- mam regiões distintas no espaçe nuclear que envolvem muitos contatos de longo alcance, sugerindo fortemente que cada segmento de DNA tem seu próprio conjunto de interações pre- ferido. Nossos dados sugerem que quando o locus β-globina é ligado, ele deixa um ambiente transcricional silencioso ge- nômico e entra em uma área nuclear onde interações com domí- nios ativos são favorecidos. Presume-se que um reposiciona- mento drástico como este mediante ativação transcricional pode bem ser uma marca distinta somente de genes específicos de tecido que atingiram um certo nível de expressão e, mais importantemente, ficaram isolados dos outros genes ativos no padrão de cromossomo linear, como é o caso para β-globina.
Propõe-se que a rede extensiva de interações de longo alcan- ce que são identificadas tanto entre loci genômicos inativos quanto entre ativos, reflita diferenças célula-para-célula em conformações de cromossomo mais que sendo uma conseqüên- cia de movimentos dinâmicos durante interfase (Chakalova et at. (2005) Nat Rev Genet 6, 669-ΊΊ (2005). Presumidamente, diferentes graus de descondensação após a divisão celular impulsionam as regiões genômicas ativas para fora da croma- tina inativa (Gilbert, N. et at. (2004) Cell 11S, 555-66 (2004)) e contatos entre loci distante de composição de cro- matina similar são estabilizados basicamente por meio das afinidades entre proteínas ligadas a cromatina. Justaposição espacial entre loci distantes pode ser funcional, mas pode também simplesmente ser a conseqüência dos parceiros de des- dobramento de um cromossomo. Enquanto loci individuais podem mover em um volume nuclear restrito, a conformação geral de um cromossomo será amplamente mantida por todo o ciclo celu- lar e exigindo divisão celular para restabelecimento. Esta idéia está de acordo com estudos de imageamento de célula vivas que mostram movimentos restritos de loci de DNA alvos no interior nuclear (Chubb et at. (2002) Curr Biol 12, 439- 45 (2002)) e se ajustam bem aos estudos que mostram que a informação da posição de cromatina nuclear é freqüentemente propagada durante a divisão celular sem ser conservado na população de células (Essers, J. et at. Mol Biol Cell 16, 769-75 (2005); Gerlich, D. et at.. Cell 112, 751-64 (2003)).
Aspectos adicionais 1 Aspectos adicionais da presente invenção são apre- sentados a seguir nos parágrafos numerados. 1. Um conjunto de sondas complementares a cada la- do de cada sitio de reconhecimento da enzima de restrição primária no genoma de uma dada espécie (por exemplo, huma- na) . 2. Um conjunto de sondas complementares a somente um lado de cada sitio de reconhecimento da enzima de restri- ção primária no genoma de uma dada espécie (por exemplo, hu- mana) , 3. Um conjunto de sondas complementares a um lado de cada outro sitio de reconhecimento da enzima de restrição primária ordenado ao longo do padrão linear do genoma de uma dada espécie (por exemplo, humana). 4. Um conjunto de sondas complementares a um lado de cada terceiro, quarto, quinto, sexto, sétimo, oitavo, no- no, décimo, vigésimo, trigésimo, quadragésimo, quinquagési- mo, sexagésimo, septuagésimo octagésimo, nonagésimo ou um centésimo sitio de reconhecimento da enzima de restrição primária ordenadas junto com o padrão linear do genoma de uma dada espécie (por exemplo, humana). 5. Um conjunto de sondas representando regiões ge- nômicas de um dado tamanho (por exemplo, cerca de 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb ou 10 Mb) (por exemplo, 50 kb-10 Mb) em torno todos loci os conhecidos para ser en- volvidos em translocações, deleções, inversões, duplicações e outros ré-arranjos genômicos. 6. Um conjunto de sondas representando regiões ge- nômicas de um dado tamanho (por exemplo, cerca de 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb ou 10 Mb) (por exemplo, 50 kb-10 Mb) em torno de uma seleção de loci conhecido para ser envolvida em translocações, deleções, inversões, dupli- cações e outros ré-arranjos genômicos. 7. Preferivelmente, a seqüência 4C (bait) está a cerca de 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb, 10 Mb, 11 Mb, 12 Mb, 13 Mb, 14 Mb ou 15 Mb ou mais da seqüência ré-arranjada atual (isto é, ponto de ruptura no caso de uma translocação). 8. Um conjunto de sondas representando o genoma completo de uma dada espécie, com cada sonda representando um fragmento de restrição simples obtido ou obtenível após digestão com uma enzima de restrição primária. 9. Um conjunto de sondas representando o genoma completo de uma dada espécie, com sondas igualmente distri- buídas junto com os padrões do cromossomo lineares. 10. Um arranjo que compreende o conjunto de sondas de acordo com qualquer uma dos parágrafos 1-10. 11. Um método para analisar a freqüência de inte- ração de uma seqüência de nucleotideos alvo com uma ou mais seqüências de nucleotideos (por exemplo, um ou mais loci ge- nômicos) que compreende o uso de uma seqüência de nucleoti- deos ou um arranjo de sondas ou um conjunto de sondas ou um arranjo aqui descrito. 12. Um método para identificar uma ou mais intera- ções de DNA-DNA que são indicativas de um estado da doença particular que compreende o uso de uma seqüência de nucleo- tideos ou um arranjo de sondas ou um conjunto de sondas ou um arranjo aqui descrito. 13. Um método de diagnóstico ou prognóstico de uma doença ou sindrome causada ou associada com uma mudança em um DNA-DNA que compreende o uso de uma seqüência de nucleo- tideos ou um arranjo de sondas ou um conjunto de sondas ou um arranjo aqui descrito. 14. Um método de arranjo para identificar um ou mais agentes que modulam uma interação de DNA-DNA que com- preende o uso de uma seqüência de nucleotideos ou um arranjo de sondas ou um conjunto de sondas ou uma sonda aqui descri- ta 15. Um método para detectar a localização de um ponto de ruptura (por exemplo, uma translocação) que compre- ende o uso de uma seqüência de nucleotideos ou um arranjo de sondas ou um conjunto de sondas ou um arranjo aqui descrito. ir.versac que ccT.preer.de c uso de uoa sequência de nuciecti- C6CS CU a. 1"2Γ3ΓΊ ~ 3 3 6 5 0Γ.Οα 3 O ■3 ^ΓΐΊ CCT.] 3Γ. ...O _Í0 S CΓ.dâ S C L, J.JT; arran]: aqui descrita. 17. Um ir.étcdc cara detectar a 1 real i cagS" de \;~m deIer?.c mu·:- ccrcreer.de c use de ac: sequência de r.uclectí- dees ou um arranjo de sondas cu um conjunto de sondas cu um arranjo aqui descrito. 18. Um método para detectar a localização de uma duplicação que compreende o uso de uma seqüência de nucleo- tídeos ou um arranjo de sondas ou um conjunto de sondas ou um arranjo aqui descrito. 19. 0 uso de microarranj os em tecnologia 4C para identificar (todos) segmentos do DNA que estão perto proxi- midade da espacial de um segmento de DNA de escolha. 20. Um microarranjo contendo as sondas homólogas às seqüências de DNA diretamente adjacente aos sítios de re- conhecimento da enzima de restrição primária presente na re- gião genômica que são incluídos na análise (que pode ser o genoma completo ou parte do genema): cada sonda localiza preferivelmente dentro de 100 bp, ou no máximo a 300 bp de um sítio de reconhecimento de enzima de restrição primária única, cu alterr.ativamente é projetada entre cada sítio de reconhecimento da enzima de restrição primária e seu sitio de reconhecimento de enzima de restrição secundária perto. 21. Um arranjo aqui descrito que compreende sondas complementares as sequências de iccí selecionados, em que o dito arranjo é representativo do genoma completo de uma dada ílz. , wTi d 1UT ò. M U d d dwüIUC d d ITI O Cdla^Id^C U j. ^ ^ ΓΓ. ■que os ioci são Icci associados ccrn uoa ou mais doenças. 2 ^ ârra-q o de acordo com o d a r a q r a f o 21 ou toa- r-1 ,-j v- z; ^oo, a*1" c u e as s e ci ê u o i a s 1 e 1 o c i s e._ e ο i o n a d o s ir.c^u- ,-, —y, 4 —,μ-Α O ^ Ví V'' Ί ^ ^ — —· í^-.-·-· •vj IOl ú«. ^ Ji-· d tÇ. A. V Λ 'w _1 !_ W vJ - J-A-· v,liijL,UiiL,^C) \Λ\-> .^4-Ls^w J_ W J- . 24. Um rr.étcdo cara analisar a frequência de inte- ração de uma seqüência de nucleotideos alvo com uma ou mais seqüências de nucleotideos de interesse (por exemplo, um ou mais loci genômico) que compreende as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotideos reticula- das ; (d) reverter a reticulação; (e} digerir as seqüências de nucleotideos com uma enzima de restrição secundária; (f) ligar as seqüências de nucleotideos; (g) amplificar uma ou mais seqüências de nucleoti- deos de interesse que são ligadas com a seqüência de nucleo- tídecs alvo usando pelo menos dois iniciadores de ciigonu- c^eotidec, em uue cada in^ciddcr nicridr^a para u±ua sequê.i cia conhecida de DNA que flanqueia as seqüências de nucleo- tideos de interesse; (h) hibridizar as seqüências amplificadas para um arranje; e [ i' determinar a freqüència de interação entre as seqüências de DNA.
Aspectos adicionais 2 Aspectos ainda adicionais da presente invenção são apresentados a seguir nos parágrafos numerados. 1. Uma seqüência de nucleotideos circularizada que compreende uma primeira e uma segunda seqüência de nucleoti- deos separadas por um sitio de reconhecimento de enzima de restrição primária e uma secundária, em que a dita primeira seqüência de nucleotideos é uma seqüência de nucleotideos alvo e a dita segunda seqüência de nucleotideos é obtenível por DNA genômico de reticulação . 2. A seqüência de nucleotideos circularizada de acordo com o parágrafo 1, em que a seqüência de nucleotideos alvo é selecionada do grupo que consiste em um promotor, um intensificador, um silenciador, um isolante, uma região de anexação de matriz, uma região de controle de locus, uma u- nidade de transcrição, uma origem de replicação, uma ponto quente de recombinação, um ponto de ruptura de translocação, um centrômero, um telômero, uma região densa em genes, uma região fraca em gene, um elemento repetitivo e um (viral) sítio de integração. 3. A seqüência de nucleotideos circularizada de acordo com o parágrafo 1, em que a seqüência de nucleotideos alvo é uma seqüência de nucleotideos que é associada com uma doença, ou que causa a mesma, ou está localizada a menos que 15 Mb em um padrão de DNA linear de um locus que é associado com uma doença, ou que causa a mesma. 4. A seqüência de nucleotideos circularizada de acordo com qualquer um dos parágrafos 1-3, em que ?. seqüôr·- cia de nucleotideos alvo é selecionada do grupo que consiste em: .-1111, XLL, MYC, SCI, BCR, A312, IGH, LYL+, TAL1, 7AL2, 1X02, 7CR ar/#3 "CFG e HGX ou outros loci associados o cm dcer.- çu ccm.c descrito cm. cgue nf TTrba1anced Chrcmoscme A- csrráiioes j_ i í rjciii. 1 íl : i d — d c t i o n. iiiCist termo c 1. Berlim: Walter de Gruyter, 20C1. ISBN 3-11-011607-3. 5. A seqüência de nucleotideos circularizada de acordo com qualquer um dos parágrafos 1-4, em que o sitio de reconhecimento da enzima de restrição primária é um sitio de reconhecimento de 6-8 bp, preferivelmente selecionado do grupo que consiste em BglII, HindIII, EcoRI, BamHI, Spel, PstI e Ndel. 6. A seqüência de nucleotideos circularizada de acordo com qualquer um dos parágrafos anteriores, em que o sitio de reconhecimento da enzima de restrição secundária é um sitio de reconhecimento seqüência de nucleotideos de 4 ou 5 bp. 7. A seqüência de nucleotideos circularizada de acordo com qualquer um dos parágrafos anteriores, em que o sitio de reconhecimento da enzima de restrição secundária está localizado a mais que cerca de 350 bp do sitio de res- trição primária. 8. A seqüência de nucleotideos circularizada de acordo com qualquer um des parágrafos anteriores, em que a seqüência de nucleotideos é marcada. 9. 'Jrr.a seqüência de r.uciectídecs que compreende uma primeira e uma segunda seqüência de nucleotideos separa- dds por. um bi.iO dc i^conhcci-cnt: dc cnzir.a de prinsrid e urnã secundária^ cnde a ditd prxiTieird s 3 c[ii ênc i 3 de nuciec 11 dsc 5 e 3 m 3. s θ o uGnoj de nue^eotziiiecs 3 ± v o, 3 s s c ^ õ d s seqüêr.cia de nucleotideos é obtenível por DNA ger.crr.icc de ücPdo^.doed.c e ^ 7'j ^ 3 d i "^1 5 corfvprjg s e cpj ê τ ^ ^ 3 de nuc 1 ect: decs Cruld cl SOJaCliC ^.a Jc Hu^itOildcCS ã _ι_ V O - 10. Um método para preparar uma sequência de nu- ciectídecs circularizada que compreende as etapas de {a} fornecer uma amostra de DNA reticuladc; (b) digerir o DNA reticulado ccm uma enzima de restrição primária; (c) ligar as seqüências de nucleotideos reticula- das ; (d) reverter a reticulação (e) digerir as seqüências de nucleotideos com uma enzima de restrição secundária; e (f} circular as seqüências de nucleotideos. 11. Um método para preparar uma seqüêncxa de nu- cleotideos que compreende as etapas de: (a) fornecer uma amostra de DNA reticulado; íb) digerir o DNA reticulado com uma enzima de restrição primária; ■c; ligar as seqüências de nucleotideos reticula- das; ídj reverter a reticulação; e; digerir as seqüências de nucleotideos com uma enzima de restrição secundária; (f) circular as seqüências de nucleotideos; e (g) amplificar uma ou mais seqüências de nucleoti- deos ligadas à seqüência de nucleotideos alvo. 12. Um método de acordo com o parágrafo 11, em que a seqüência de nucleotideos circularizada visada é lineari- zada antes da amplificação. 13. Um método de acordo com o parágrafo 12, em que a seqüência de nucleotideos visada circularizada é lineari- zada usando uma enzima de restrição que reconhece um sitio de reconhecimento de 6 bp ou mais. 14. Um método de acordo com qualquer um dos pará- grafos 10-13, em que a seqüência reticulada de nucleotideos é amplificada usando PCR 15. Um método de acordo com o parágrafo 14, em que a seqüência reticulada de nucleotideos é amplificada usando PCR inversa 16. Um método de acordo com o parágrafo 14 ou pa- rágrafo 15, em que é usado o Sistema PCR Padrão Expand Long (Roche). 17. Um método para analisar a freqüência de inte- ração de uma seqüência de nucleotideos alvo com uma ou mais seqüências de nucleotideos (por exemplo, um ou mais loci ge- nômico) que compreende o uso de uma seqüência de nucleoti- deos de acordo com qualquer um dos parágrafos 1-9. 18. Um arranjo de sondas imobilizadas em um supor- te que compreende uma ou mais sondas que hibridizam ou são capazes de hibridizar para uma seqüência de nucleotideos de acordo com qualquer um dos parágrafos 1-9. 19. Um conjunto de sondas complementares em se- qüência c^r:. u seqüência de ácido nucléico edjaeer.ee e cada un dos sities de reconhecimento da enzima de restrição pri- mária de uma enzima primária restrição no DNA genômico. 20. Um conjunto de sotdα 5 de aco roc ccm o ρ a r a g r a fo 15, em que as sendas são complementares em sequência com a sequência de ácido nucléico a -ada lade do cada um des sítios de reconhecimento da enzima de restrição pri- mária de uma enzima de restrição primária no DNA genômico. 21. Um conjunto de sondas de acordo com o parágra- fo 19 ou parágrafo 20, em que as ditas sondas são complemen- tares em seqüência com a seqüência de ácido nucléico que es- tá menos que 300 pares base de cada um dos sítios de reco- nhecimento da enzima de restrição primária de uma enzima de restrição primária no DNA genômico. 22. Um conjunto de sondas de acordo com qualquer um dos parágrafos 19-21, em que as sondas são complementares à seqüência que está a menos de 300 bp de cada um dos sítios de reconhecimento da enzima de restrição primária de uma en- zima de restrição primária em DNA genômico. 23. Um conjunto de sondas de acordo com qualquer um dos parágrafos 19-22, em que as sondas são complementares à seqüência que está entre 200 e 300 bp de cada um dos sí- tios de reconhecimento da enzima de restrição primária de uma enzima de restrição primária p.c DNA genômico. 24. Um conjunto de sondas de acordo com qualquer um dos parágrafos 19-23, em que as sendas são complementares à seqüência que está entre 100 e 200 bp de cada um dos sí- tios de reconhecimento da enzima de restrição primária de ura <= η"' τ ri oe resnicàu υ: 1:;;αιια ηο UMA ger.êmiec. 25. :Jm conjunto de sondas cie acordo com qualquer um des paragrares 19 — 24, em que ouas cu n.sis oas scr.cias sao projetadas que sàc capazes de hitridizar com a seqüêr.cia ad- ·-.··· - ·· - - -i - v-~-— -^-»-,1-.,;·^,-.·! i-ν'HdC pCi r> "r ry, qa "]p ■^ÉtiC··}--/'·- — m tt... „ ut a. cuoo '·■ .. J — -u -l ção primária oe uma enzima de restrição primária r.c UNA ge- nômico. 26. Um conjunto de sondas de acordo com o parágra- fo 25, em que as sondas sebrepõem-se, ou sobrepõem-se parci- almente. 27. Um conjunto de sondas do parágrafo 26, em que a sobreposição é menos que 10 nucleotideos. 28. Um conjunto de sondas de acordo ccm qualquer um dos parágrafos 19-27, em que a seqüência de sondas cor- responde a toda ou parte da seqüência entre cada um dos sí- tios de reconhecimento da enzima de restrição primária de uma enzima de restrição primária e cada um dos primeiros sí- tios de reconhecimento de enzima de restrição secundária vi- zinhos de uma enzima de restrição secundária. 29. Um conjunto de sondas de acordo com qualquer um des parágrafos 19-28, em que cada sonda é pelo menos 25 mer. 30. Um conjunto de sondas de acordo ccm qualquer um dos parágrafos 19-29, em que cada uma das sondas é 25-60 mer . 31. Um processo para preparar um conjunto de son- das que compreende as etapas de: Ça) identificar cada um dos sítios de reconhecí- r.er.f e ia em ma de iesv.i _vã- - r i.t.áriu par- uma enzima dr> restri :ãc primária eia ONA ger.cmi cc; ;b; prejszar sondas que sãc capazes de hicriaizar cem s s 6 q u β n c i a ad] acerpe a o a d a um o c s si" ics ce zeccr.r.ecí- .TlS r. t e uã cZiCiZâ de zcccicpac primar o a ·~ o -t- gen cm cc ; , c Sj-'"i.'C£'Cj-Zéi27 ciS 6 JI. JaS / — (d) combinar as sondas entre si para formar um conjunto de sondas ou substancialmente um conjunto de son- das . 32. Um processo de acordo com o parágrafo 31, em que as sondas são produtos de amplificação PCR. 33. Um conjunto de sondas, ou substancialmente um conjunto de sondas obtido ou obtenível pelo processo de a- cordo com o parágrafo 31 ou parágrafo 32. 34. Um arranjo compreendendo um arranjo de sondas de acordo com o parágrafo 18 ou substancialmente o conjunto de sondas de acordo com qualquer um dos parágrafos 19-30 ou 33. 35. Um arranjo que compreende o conjunto de sondas de acordo com qualquer um dos parágrafos 19-30 ou 33. 36. Um arranjo de acordo com o parágrafo 34 ou pa- rágrafo 35, em que o arranje compreende cerca de 30C.CQC- 400.OCC sondas. 331. Um arranje de acordo com qualquer um des pará- grafos 34-36, em que c arranjo compreende cerca de 565.OCO cu mais sondas, preferivelmente, cerca de 750.000 sondas, mais preferivelmente, 6 x 750.000 sondas. 33. Um arranjo de acordo cem qualquer um des cará- grafos 34-37, em que, se o número de sondas exceder o número de sondas que pode ser contido em um arranjo simples, então o arranjo compreenderá ou consistirá em uma representação do genoma completo de uma dada espécie em baixa resolução. 39. Um arranjo de acordo com o parágrafo 38, em que uma a cada 2, 3, 4, 5, 6, 7, 8, 9 ou 10 sondas ordenadas em um padrão de cromossomo linear é contida no arranjo. 40. Um processo para preparar um arranjo que com- preende a etapa de imobilizar em um suporte substancialmente sólido o arranjo de sondas de acordo com o parágrafo 18 ou substancialmente o conjunto de sondas de acordo com qualquer um dos parágrafos 19-30 ou 33. 41. Um processo para preparar um arranjo que com- preende a etapa de imobilizar em um suporte sólido o arranjo de sondas de acordo com o parágrafo 18 ou o conjunto de son- das de acordo com qualquer um dos parágrafos 19-30 ou 33. 42. Um arranjo obtido ou obtenível pelo método de acordo com o parágrafo 40 ou parágrafo 41. 43. Um método para analisar a freqüência de inte- ração de uma seqüência de nucleotídeos visada com uma ou mais seqüências de nucleotídeos (por exemplo, um ou mais lo- ci genômico) que compreende as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticula- das; (d) reverter a reticulação; (e) utjci li aá seqüências dc nucleotídeos com. ura enzãm.a de restrição secundária; (f} :ir:u.ar as seqüências áe r.uc iect idees; (g) amplificar ur.a ou mais seqüências de nucleetí- üoco que sã: ligadas à sequência à- iç-c ~ãv~; ■ luciis-.a: „pci^..al:..e...e ai seqüências em.pli- iicadas para um arranje; e (h) determinar a freqüência de interação entre as seqüências de DNA. 44. Um método para identificar uma ou mais intera- ções de DNA-DNA que são indicativas de um estado da doença particular que compreende as etapas de: (a) fornecer uma amostra de DNA reticulado de uma célula doente e um não doente; (b) digerir o DNA reticulado em cada um das amos- tras com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticula- das; (d) reverter a reticulação; (e) digerir as seqüências de nucleotídeos ccm uma enzima de restrição secundária; (f) circular as seqüências de nucleotídeos; (g) amplificar uma ou mais seqüências que são li- gadas à sequência de nucleotídeos alvo; (h) hibridizar cpcicnaim.er.re as seqüências de nu- ciectídecs amplificadas para um arranjo; e (i; determinar a frequência de interação entre as seqüências de DNA, ·■···' ene orna oi rere;iCci eütic o ireqücncic uc intera- ção entre as sequências de DMA. das células doentes e não do- entes o n d o o a cree o interação de e — r.d——·. ^..·. estado de cioença perticuian. ^ T ; -.-J-, ê "" " d d·' f Ç p ^ —■ -S p +■ ’ — — ■ ' p >'/'ΠΓΓς^ i Pn d P U n e doença cu sindrome causada ou assuciátio o^ia uma mu danço em. uma interação de DNA-DNA que compreende as etapas de: (a) fornecer uma amostra de DNA reticuiado de um sujeito; (b) digerir o DNA reticuiado com uma enzima de restrição primária; (c) ligar o seqüências de nucleotídeos reticula- das; (d) reverter a reticulação; (e) digerir as seqüências de nucleotídeos com uma enzima de restrição secundária; (f) circular as seqüências de nucleotídeos; (g} amplificar uma ou mais seqüências que são li- gadas à seqüência de nucleotídeos alvo; (h} hibridizar opcionalmente as seqüências ampli- ficadas de nucleotídeos para um arranjo; ;i) determinar a frequência de interação entre as seqüências de DNA; e (j) comparar a frequência de interação entre as seqüências de DNA ccm aquela de um controle não afetado; em que uma diferença entre o valor obtido dc con- trole e o valer obtido do sujeito é indicativo que c sujeito sofre da doença ou sindrome ou é indicativo que o sujeito c ·ρ 1" γ* A v* p rj r p r g ριι l r'· O rO ΓΠ ^ . 46. Um métcdo de acordo com. o parágrafo 45, em que --ΓΤ.3. _ ΓάΓ. 3 1 3d C 33.5.S 11S 3? ^ θ Γ. C 1 â S 3â IV "I θ V 3. Ç 3 0 C31X3 Ό 3 Z 3 3 + 33 3 X Γ; á I_ Ca “ JL V d da iCCâilZaÇàC Q6 UIT: CCWO Q Θ r^ptUld . d ■ * '-JiT TlC —C3Íw CaC C C C C ld -3 C^C 3 .gcp um paarão inverso de rrequèncias de mieidcdo de ddA-ddA pa- ra a amostra do sujeito comparado com, o controle é indicati- vo de uma inversão. 48. Um método de acordo com o parágrafo 45 em que uma redução na interação de frequência de DNA-DNA com a a- mostra do sujeito comparado com o controle, em combinação com um aumento na interação de freqüência de DNA-DNA para regiões mais distantes, é indicativa de deleçâo. 49. Um método de acordo com o parágrafo 45, em que um aumento ou uma diminuição na interação de freqüência de DNA-DNA com a amostra do sujeito comparado com o controle é indicativo de uma duplicação ou inserção. 50. Um método de acordo ccm qualquer um dos pará- grafos 45-49, em que cariotipagem espectral e/ou FISH é usa- do antes de realizar o dito método. 51. Um métcdo de acordo com qualquer um dos pará- grafos 45-50, em que a doença é uma doença genética. 52. Um método de acorde ccm qualquer um des pará- grafos 45-51, em que a doença é câncer. 53. Um métcdo de diagnóstico ou prognóstico de uma doença ou sir.d reme causada ou associada ccm uma mudança em uma interação de DNA-DNA que compreende as etapas de: (a) fornecer uma amostra de DNA reticuiado de um ib; digerir o DNA reticui ado com uma enzima de restrição prioana; í c) ligar as sequências de nucieouidecs reticuia- aa s; (d) reverter a reticuj.ação; (e) digerir as seqüências de nuciectideos com uma enzima de restrição secundária; (f) circular as seqüências de nucleotideos; (g) amplificar duas ou mais seqüências que são li- gadas à seqüência de nucleotideos alvo [s); (h) marcação o duas ou mais seqüências amplifica- das; (i) hibridizar as seqüências de nucleotideos em um arranjo; (j) determinar a freqüência de interação entre as seqüências de DNA; e (j) identificar um ou mais loci que foram submeti- dos a um ré-arranjo gencmico que é associado ccm uma doença. 54. Um método de acordo com o parágrafo 53, em que as duas cu mais seqüências amplificadas são diferencialmente marcadas. 55. Um método de acordo ccm o parágrafo 54, em que as duas ou mais seqüências amplificadas são identicamente marcadas quando as seqüências residem em diferentes croncs- 3 OITIC S . 56. Um método de accrdc com o parágrafo 53, em que as duas ou mais seqüências amplificadas são identicamente mai.ajas άί seqüências residem r.t m.esm.c 'remos.?'"-···' uma distância que é grande c bastante para sobreposição mí- nima entre interação de sinais de DNA-DNA. 5". im m.étodo de arranjo para identificar um tu :r.aic agentes que modu". am uma interação de DNA.-DNA que com- G2T0 0 ΠGΘ d. 3 t: L d L α b dc ! (a) colocar em contato uma amestra com um ou mais agentes; (b) fornecer DNA reticulado da amostra; (c) digerir o DNA reticulado com uma enzima de restrição primária; (d) ligar as seqüências de nucleotideos reticula- das; (e) reverter a reticulação; (f) digerir as seqüências de nucleotideos com uma enzima de restrição secundária; (g) circular as seqüências de nucleotídeos; (h) amplificar uma ou mais seqüências de nucleotí- deos que são ligadas à seqüência de nucleotideos alvo; (i) hibridizar opcionalmente as seqüências ampli- ficadas de nucleotideos para um arranjo; e (j) determinar a freqüência de interação entre as seqüências de DNA, em que uma diferença entre (i) a freqüência de in- teração entre as seqüências de DNA r.a presença dc agente e uii a freqüência de interação entre as seqüências de DNA na ausência do agente é indicativo de um agente que modula a interação de DNA-DNA. I.'. Um m.útcdc 5·?...·■ ^ ' ·- · · -. ·; · ie um CCr.tZ QS rUDZUrU COT cXc.T.p.C, Um3 “ Γ3Γι3 ^ CC3 ÇâC OJ6 COmpre- ■3r.áe as etapas de: s; fornecer ona amestra de DNA ret icu.1 a do; : fc' di- gerir t DNA ret ’ .-;1 cot uma enzima de restrição primária; CJcd,’"' ' Ac v> ,'’ 1 a •f' Ί H q n c r a f 1 m 11 : p — das; (d) reverter a reticulação; (e) digerir as seqüências de nucleotideos com uma enzima de restrição secundária; (f) circular as seqüências de nucleotideos; (g) amplificar uma ou mais seqüências que são li- gadas à seqüência de nucleotideos alvo; (h) hibridizar opcionalmente as seqüências ampli- ficadas de nucleotideos para um arranjo; (i) determinar a freqüência de interação entre as seqüências de DNA; e (j) comparar a freqüência de interação entre as seqüências de DNA com aquela de um controle; em que um transição de baixa a alta interação de freqüência de DNA-DNA na amostra comparado com o controle é indicativo da localização de um ponto de ruptura. 59. Um método para detectar a localização de uma inversão que compreende as etapas de: •a} fornecer uma amestra de UNA rezicuiadc; 'b) digerir o DNA reticuladc com um,a enzima de restrição prim.árfa; {c; ligar as seqüências de nucleotideos reticuia- das, (d) rSV6ItSr â IStivJU*ãÇ3C,· (e) digerir as sequências de nucleccidecs ccrr. urr.a enzima de restrição secundária; (f) ?i rcu i a r as sequências r.uclectídecs; ^ J ^ 3^3. 3 3 ^ n - C- 3 d mj i ~ es Cin z — gadas à sequência de nucleotídeos alvo; (h) hibridizar opcionalmente as seqüências ampli- ficadas de nucleotídeos para um arranjo; (i) determinar a freqüência de interação entre as seqüências de DNA; e (j) comparar a freqüência de interação entre as seqüências de DNA com a de um controle; em que um padrão inverso de frequências da intera- ção de DNA-DNA com a amostra comparado com o controle é in- dicativo de um inversão. 60. Um método para detectar a localização de uma deleção que compreende as etapas de; (a) fornecer uma amostra de DNA reticulado; {b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos retícula- da; id) reverter a reticulaçãc; íe) digerir as seqüências de nucleotídeos com u;::a enzima de restrição secundária; f; circular as seqüências de nucleotídeos; (g) amplificar uma cu mais seqüências que sãc 11- (n) hibridizar occiunalmer.ze as sequências arr=p_i- 11 ca das de r.ucieciiciscs cu~ u τη 3 r r a π ~ c ; (i) determinar a frequência de interação entre as ^ ^ J. ^ ^ r, c o. '“'■M L ■ seqüências de DNA com a de um cor.trole; em que uma redução na interação de freqüência de DNA-DNA com a amostra comparado com o controle é indicativo de deleção. 61. Um método para detectar a localização de uma duplicação que compreende as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticula- das ; (d) reverter a reticulação, (e) digerir as seqüências de nucleotídeos com uma enzima de restrição secundária; (F) circular as seqüências de nucleotídeos; i,g} amplificar uma ou mais seqüências que são li- gadas à sequência de nucleotídeos alvo; (h; hibridizar opcionalmente as seqüências ampli- ficadas de nucleotídeos para um arranjo; íi; determinar a freqüência de interação entre as seqüências de DNA; e (j; comparar a freqüência de interação entre as ü t: u ü c. i ± α S 0 6 ljlίPi C Γ0 0 OC JΓΓ, C C Π tl 2Γ O ... 0 ’ ΘΓΓι QUe UlTi âUfuSfiLO CU ülT.â dIITlI. ΠUI Ç-d O ΘΓΤ1 1 Γ β C[U0 Γ. C Z_ 3. ce ir.:era;àc de CNA-DXA ccm a amestra do sujeite comparado ccm o ccr.ircie é indicativo de uma duplicação ou inserção. 6?. :im ager^e obtido ou obtenível pelo método de C5--.I CÍiij u- u 0 0 -w· '_\_Ίΐί v_> -_>'·* 63. use de uma seqüência de nuclectidees de acordo ccm qualquer um dos parágrafos 1-9 para identificar uma cu mais interações de DNA-DNA em uma amestra. 64. Uso de uma seqüência de nucleotídeos de acordo com qualquer um dos parágrafos 1-9 para o diagnóstico ou prognóstico de uma doença ou síndrome causada ou associada com uma mudança em uma interação de DNA-DNA. 65. Uso de um arranjo de sondas de acordo com o parágrafo 18 ou o conjunto de sondas de acordo com qualquer um dos parágrafos 19-30 ou 33 para identificar uma ou mais interações de DNA-DNA em uma amostra. 66. Uso de um arranjo de sondas de acordo com o parágrafo 18 ou o conjunto de sondas de acordo com qualquer um dos parágrafos 19-30 ou 33 para o diagnóstico ou prognós- tico de uma doença ou síndrome causada ou associada com uma .mudança em uma interação de DNA-DNA. 67. Uso de um arranjo, de acorde ccm qualquer um dos parágrafos 34-39 ou 42 para identificar uma ou mais in- terações de DNA-DNA em uma amestra. 63. Uso de um arranjo de acordo com qualquer um des parágrafos 34-39 ou 42 para o diagnóstico ou prognóstico de uma doença ou síndrome causada ou associada com uma mu- 69. 'Jso de acordo com qualquer um dos parágrafos 14, cc ou c5, em que o dfagnóscict ou prcgr.óscicc é diagr.és- oiso cu prognóstico pré-ratal. 70. Um substancialmente aoui descrito e cem referência a qualquer dos Exemplos ou Figuras. 71. Um arranjo de sondas substancialmente aqui descrito e com referência a qualquer dos Exemplos ou Figu- ras . 72. Um conjunto de sondas substancialmente aqui descrito e com referência a qualquer dos Exemplos ou Figu- ras . 73. Um processo substancialmente aqui descrito e com referência a qualquer dos Exemplos ou Figuras. 74. Um arranjo substancialmente aqui descrito e com referência a qualquer dos Exemplos ou Figuras. 75. Um método de arranjo substancialmente aqui descrito e com referência a qualquer dos Exemplos ou Figu- ras . 76. Um agente substancialraente aqui descrito e com referência a qualquer dos Exemplos ou Figuras. 77. Um uso substanciaimente aqui descrito e com referência a qualquer dos Exemplos ou Figuras.
Tabela 2 Γ2 θ 1 fd 2_ t: í i C _l d S
Blanton J, Gaszner M, Schell P. 2CG3. Pro- teinrprotein ínteractions and the pairing of botmdary ele- ments in vivo. Genes Dev 17:664-75.
Dekker, J. , Rippe, K., Dekker, M., and Kleckner, N. 2002. Capturing chromosomi conformation. Science 295: 1306-11.
Drissen R, Palstra. RJ, Gillemans N, Splinter E, Grosveld F, Philipsen S, de Laat W. 2004. The active spatial organization of the beta-globin locus requires the tran- scription factor EKLF. Genes Dev 18:2485-90.
Horike S, Cai S, Miyano M, Cheng JF, Kohwi- Shigematsu. T. 2005. Loss of silent-chromatin looping and impaired imprinting of DLX5 in Rett syndrome. Nat Genet 37:31-40.
Murrell A, rieescn S, Reik W. 2004. Interaction be- tween drftererr.ia.L_y rr.etryxated regicrs partxtxcr.s the xrc— printed genes Igf2 and H19 into parent-specific chrcrr.atir. loops. Nat Genet 36:889-93.
Palstra, R.J., Tolnuis, B, Splinter, Ξ. , Nijmei- jer, R, Grcsveld, F., and de Laat, W. 2003. The beta-glcfcin nuclear ccrr.partmer.t in develcprr.ent and erythroid differen- tiaticn. Nat Genet 35: 190-4. p a -r ι r·. ,'' ç ’’ 2 72 ηρ K* ^ ^ # V Qg 3 ~ 0 t ” Langeveld, A., Irnanra, Α..Μ.Λ, Stroubculzs, J., de Laat, W., aza Grcsveld, F. 3. 2 C 2 4 ; . Multipie ir.teractior.s betweer. regulatcry regicr.s are required to stabilize a active chrc- matir. hub. Genes & Dev. 18: 14 95-15C9. -1 1 ί’.'ώ ' Λ J 7 ρ.·ν- vp i“ -jp trachrcmosoma1 interactions no T helper type 2 cytokine Io- cus. Nat Immunol 5:1017-27.
Tolhui.s, B., Palstra, R.J., Splinter; E., &osveld, F., and de Laat, W. 2002. Looping and interaction between hypersensitive sites in the active beta-globin lo- cus. Molecular Cell 10: 1453-65.Vakoc CR, Letting DL, Ghel- dof N, Sawado T, Bender MA, Groudine M, Weiss MJ, Dekker 3, Blobel GA. 2005. Proximity among distant regulatory elements at the betaglobin locus requires GATA 1 and FOG-1. Mol Cell. 17:453~62Todas publicações nas especificações supramenciona- das estão aqui incorporadas pela referência. Várias modifi- cações e variações dos métodos descritos e sistema da inven- ção ficarão aparentes aos versados na tecnologia sem fugir do escopo e espirito da invenção. Embora a invenção seja descrita ccm relação às modalidades especificas preferidas, deve-se entender que a invenção reivindicada não se limitará indevidamente a tais modalidades especificas. Efetivamente, várias modificações das maneiras descritas para realizar a invenção que são óbvias aos versados em biologia molecular ou campos relacionados estarão no escopo das reivindicações seguintes.

Claims (29)

1. Método para analisar a freqüência de interação de uma seqüência de nucleotídeos alvo com uma ou mais seqüências de nucleotídeos de interesse (por exemplo, um ou mais loci genômicos), CARACTERIZADO pelo fato de que compreende as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticuladas; (d) reverter a reticulação; (e) digerir as seqüências de nucleotídeos com uma enzima de restrição secundária; (f) ligar uma ou mais seqüências de DNA de composição de nucleotídeo conhecida ao(s) sítio(s) de digestão de enzima de restrição secundária disponível(s) que flanqueia(m) uma ou mais seqüências de nucleotídeos de interesse; (g) amplificar uma ou mais seqüências de nucleotídeos de interesse usando pelo menos dois iniciadores de oligonucleotídeo, em que cada iniciador hibridiza para as seqüências de DNA que flanqueiam as seqüências de nucleotídeos de interesse; (h) hibridizar a(s) seqüência(s) amplificada(s) em um arranjo; e (i) determinar a freqüência de interação entre as seqüências de DNA.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que a reação da ligação na etapa (f) resulta na formação de círculos de DNA.
3. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que a seqüência de nucleotídeos alvo é selecionada do grupo que consiste em um rearranjo genômico, promotor, um intensificador, um silenciador, um isolante, uma região de anexação de matriz, uma região de controle de locus, uma unidade de transcrição, uma origem de replicação, um ponto quente de recombinação, um ponto de ruptura de translocação, um centrômero, um telômero, uma região densa em genes, uma região pobre em genes, um elemento repetitivo e um sitio de integração (viral).
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, CARACTERIZADO pelo fato de que a seqüência de nucleotídeos alvo é uma seqüência de nucleotídeos que está associada com uma doença, ou causa a mesma, ou é localizada até 15 Mb ou mais em um padrão de DNA linear de um locus que é associado com uma doença, ou causa a mesma.
5. Método, de acordo com qualquer uma das reivindicações 1 a 4, CARACTERIZADO pelo fato de que a seqüência de nucleotídeos alvo é selecionada do grupo que consiste em; AML1, MLL, MYC, BCL, BCR, ABL1, IGH, LYL1, TAL1, TAL2, LM02, TCRa/δ, TCR/3 e HOX ou outros loci associados com doença.
6. Método, de acordo com qualquer uma das reivindicações 1 a 5, CARACTERIZADO pelo fato de que a enzima de restrição primária é uma enzima de restrição que reconhece um sitio de reconhecimento de 6-8 bp.
7. Método, de acordo com a reivindicação 6, CARACTERIZADO pelo fato de que a enzima de restrição primária é selecionada do qrupo que consiste em BqlII, HindIII, EcoRI, BamRI, Spel, PstI e Ndel.
8. Método, de acordo com qualquer uma das reivindicações 1 a 7, CARACTERIZADO pelo fato de que a enzima de restrição secundária é uma enzima de restrição que reconhece um sitio de reconhecimento de seqüência de nucleotideos de 4 ou 5 bp.
9. Método, de acordo com qualquer uma das reivindicações 1 a 8, CARACTERIZADO pelo fato de que o sitio de reconhecimento da enzima de restrição secundária está localizado em mais que cerca de 350 bp do sitio de restrição primária na seqüência de nucleotideos alvo.
10. Método, de acordo com qualquer uma das reivindicações 1 a 9, CARACTERIZADO pelo fato de que a seqüência de nucleotideos é marcada.
11. Método para analisar a freqüência de interação de uma seqüência de nucleotideos alvo com uma ou mais seqüências de nucleotideos (por exemplo, um ou mais loci genômicos), CARACTERIZADO pelo fato de que compreende as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências reticuladas de nucleotídeo; (d) reverter a reticulação; (e) digerir as seqüências de nucleotídeos com uma enzima de restrição secundária; (f) circular as seqüências de nucleotídeo; (g) amplificar a uma ou mais seqüências de nucleotídeos que são ligadas à seqüência de nucleotídeos alvo; (h) hibridizar opcionalmente as seqüências amplificadas em um arranjo; e (i) determinar a freqüência de interação entre as seqüências de DNA.
12. Método para identificar uma ou mais interações de DNA-DNA que são indicativas de um estado da doença particular, CARACTERIZADO pelo fato de que compreende a etapa de realizar as etapas (a)-(i) conforme definidas nas reivindicações 1-11, em que na etapa (a) uma amostra de DNA reticulado é fornecida de uma célula doente e uma não doente, e em que uma diferença entre a freqüência de interação entre as seqüências de DNA das células doente e não doente indica que a interação de DNA-DNA é indicativa de um estado de doença particular.
13. Método de diagnóstico ou prognóstico de uma doença ou sindrome causada ou associada com uma mudança em uma interação de DNA-DNA, CARACTERIZADO pelo fato de que compreende a etapa de realizar as etapas (a)-(i) conforme definidas nas reivindicações 1-11, em que a etapa (a) compreende fornecer uma amostra de DNA reticulado de um sujeito; e em que a etapa (i) compreende comparar a freqüência de interação entre as seqüências de DNA com a de um controle não afetado; em que uma diferença entre o valor obtido do controle e o valor obtido do sujeito é indicativa que o sujeito sofre da doença ou sindrome ou é indicativa que o sujeito sofrerá da doença ou sindrome.
14. Método, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que uma transição de freqüência de interação baixa para alta é indicativa da localização de um ponto de ruptura equilibrado e/ou desequilibrado.
15. Método, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que um padrão inverso de freqüências da interação de DNA-DNA para a amostra do sujeito comparado com o controle é indicativa de um inversão equilibrada e/ou desequilibrada.
16. Método, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que uma redução na freqüência de interação de DNA-DNA para a amostra do sujeito comparada com o controle, em combinação com um aumento na frequência interação de DNA-DNA para regiões mais distantes, é indicativa de uma deleção equilibrada e/ou desequilibrada.
17. Método, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que um aumento ou uma diminuição na frequência interação de DNA-DNA para a amostra do sujeito comparado com o controle é indicativo de uma duplicação ou inserção equilibrada e/ou desequilibrada.
18. Método, de acordo com qualquer uma das reivindicações 13 a 17, CARACTERIZADO pelo fato de que cariotipagem espectral e/ou FISH é usado antes de realizar o dito método.
19. Método, de acordo com qualquer uma das reivindicações 13 a 18, CARACTERIZADO pelo fato de que a doença é uma doença genética.
20. Método, de acordo com qualquer uma das reivindicações 13 a 19, CARACTERIZADO pelo fato de que a doença é câncer.
21. Método de diagnóstico ou prognóstico de uma doença ou sindrome causada ou associada com uma mudança em uma interação de DNA-DNA, CARACTERIZADO pelo fato de que compreende a etapa de: realizar as etapas (a)-(i) conforme definidas nas reivindicações 1-11, em que a etapa (a) compreende fornecer uma amostra de DNA reticulado de um sujeito; e em que o dito método compreende a etapa adicional de: (j) identificar um ou mais loci que foram submetidos a um rearranjo genômico que é associado com uma doença.
22. Método, de acordo com a reivindicação 21, CARACTERIZADO pelo fato de que as duas ou mais seqüências amplificadas são diferencialmente marcadas.
23. Método, de acordo com a reivindicação 21, CARACTERIZADO pelo fato de que as duas ou mais seqüências amplificadas são identicamente marcadas quando as seqüências residem em diferentes cromossomos.
24. Método, de acordo com a reivindicação 21, CARACTERIZADO pelo fato de que as duas ou mais seqüências amplificadas são identicamente marcadas quando as seqüências residem no mesmo cromossomo a uma distância que é grande o bastante para mínima sobreposição entre sinais de interação de DNA-DNA.
25. Método de arranjo para identificar um ou mais agentes que modulam uma interação de DNA-DNA, CARACTERIZADO pelo fato de que compreende as etapas de: (a) colocar em contato uma amostra com um ou mais agentes; e (b) realizar as etapas (a) a (i) conforme definidas nas reivindicações 1-11, em que a etapa (a) compreende fornecer DNA reticulado da amostra; em que uma diferença entre (i) a freqüência de interação entre as seqüências de DNA na presença do agente e (ii) a freqüência de interação entre as seqüências de DNA na ausência do agente é indicativa de um agente que modula a interação de DNA-DNA.
26. Método para detectar a localização de um ponto de ruptura equilibrado e/ou desequilibrado (por exemplo, uma translocação), CARACTERIZADO pelo fato de compreender as etapas de: (a) realizar as etapas (a) a (i) conforme definidas nas reivindicações 1-11; e (b) comparar a freqüência de interação entre as seqüências de DNA com a de um controle; em que uma transição da freqüência de interação de DNA-DNA baixa para alta na amostra comparada com o controle é indicativa da localização de um ponto de ruptura.
27. Método para detectar a localização de uma inversão equilibrada e/ou desequilibrada, CARACTERIZADO pelo fato de que compreende as etapas de: (a) realizar as etapas (a) a (i) conforme definidas nas reivindicações 1-11; e (b) comparar a freqüência de interação entre as seqüências de DNA com a de um controle; em que um padrão inverso de freqüências de interação de DNA-DNA para a amostra comparadas com o controle é indicativo de um inversão.
28. Método para detectar a localização de um deleção, CARACTERIZADO pelo fato de que compreende as etapas de: (a) realizar as etapas (a) a (i) conforme definidas nas reivindicações 1-11; e (b) comparar a freqüência de interação entre as seqüências de DNA com a de um controle; em que uma redução na frequência de interação de DNA-DNA para a amostra comparada com o controle é indicativa de deleção.
29. Método para detectar a localização de um duplicação, CARACTERIZADO pelo fato de que compreende as etapas de: (a) realizar as etapas (a) a (i) conforme definidas nas reivindicações 1-11; e (b) comparar a freqüência de interação entre as seqüências de DNA com a de um controle; em que um aumento ou uma diminuição na frequência de interação de DNA-DNA para a amostra do sujeito comparado com o controle é indicativo de uma duplicação ou inserção.
BRPI0611702-3A 2005-07-04 2006-07-03 Captura e caracterização de cromatina co-localizada (4c) BRPI0611702B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB0513676.7 2005-07-04
GBGB0513676.7A GB0513676D0 (en) 2005-07-04 2005-07-04 4c
GB0605449.8 2006-03-17
GBGB0605449.8A GB0605449D0 (en) 2006-03-17 2006-03-17 4c
PCT/IB2006/002268 WO2007004057A2 (en) 2005-07-04 2006-07-03 Chromosome conformation capture-on-chip (4c) assay

Publications (2)

Publication Number Publication Date
BRPI0611702A2 BRPI0611702A2 (pt) 2010-09-28
BRPI0611702B1 true BRPI0611702B1 (pt) 2015-05-19

Family

ID=37604842

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0611702-3A BRPI0611702B1 (pt) 2005-07-04 2006-07-03 Captura e caracterização de cromatina co-localizada (4c)

Country Status (18)

Country Link
US (2) US20070231817A1 (pt)
EP (1) EP1899488B1 (pt)
JP (1) JP5416405B2 (pt)
KR (1) KR101383593B1 (pt)
AU (1) AU2006264564B2 (pt)
BR (1) BRPI0611702B1 (pt)
CA (1) CA2614118C (pt)
CY (1) CY1117260T1 (pt)
DK (1) DK1899488T3 (pt)
ES (1) ES2556113T3 (pt)
HU (1) HUE026922T2 (pt)
IL (1) IL187919A (pt)
NO (1) NO20076430L (pt)
NZ (1) NZ564262A (pt)
PL (1) PL1899488T3 (pt)
RU (1) RU2478716C2 (pt)
SI (1) SI1899488T1 (pt)
WO (1) WO2007004057A2 (pt)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0603251D0 (en) 2006-02-17 2006-03-29 Isis Innovation DNA conformation
US8071296B2 (en) 2006-03-13 2011-12-06 Agency For Science, Technology And Research Nucleic acid interaction analysis
AU2008204338B2 (en) * 2007-01-11 2014-03-06 Erasmus University Medical Center Circular chromosome conformation capture (4C)
US8263367B2 (en) 2008-01-25 2012-09-11 Agency For Science, Technology And Research Nucleic acid interaction analysis
WO2010036323A1 (en) * 2008-09-25 2010-04-01 University Of Massachusetts Medical School Method of identifing interactions between genomic loci
EP4063518A1 (en) 2010-07-09 2022-09-28 Cergentis B.V. V3-d genomic region of interest sequencing strategies
GB2519255B (en) 2013-02-01 2016-01-06 Univ California Methods for genome assembly and haplotype phasing
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
GB2517936B (en) * 2013-09-05 2016-10-19 Babraham Inst Chromosome conformation capture method including selection and enrichment steps
GB201320351D0 (en) * 2013-11-18 2014-01-01 Erasmus Universiteit Medisch Ct Method
GB2520765A (en) 2013-12-02 2015-06-03 Vanadis Diagnostics Ab Multiplex detection of nucleic acids
GB2520763A (en) 2013-12-02 2015-06-03 Vanadis Diagnostics Ab Nucleic acid probe and method of detecting genomic fragments
WO2015089243A1 (en) 2013-12-11 2015-06-18 The Regents For Of The University Of California Methods for labeling dna fragments to recontruct physical linkage and phase
CA2956925C (en) 2014-08-01 2024-02-13 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
EP3031929A1 (en) 2014-12-11 2016-06-15 Mdc Max-Delbrück-Centrum Für Molekulare Medizin Berlin - Buch Genome architecture mapping
CA2976902A1 (en) 2015-02-17 2016-08-25 Dovetail Genomics Llc Nucleic acid sequence assembly
GB2554572B (en) 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
WO2016207647A1 (en) 2015-06-24 2016-12-29 Oxford Biodynamics Limited Epigenetic chromosome interactions
KR20180096586A (ko) 2015-10-19 2018-08-29 더브테일 제노믹스 엘엘씨 게놈 어셈블리, 하플로타입 페이징 및 표적 독립적 핵산 검출을 위한 방법
WO2017066907A1 (zh) * 2015-10-19 2017-04-27 安诺优达基因科技(北京)有限公司 一种构建高可利用数据率的Hi-C文库的方法
SG11201807117WA (en) 2016-02-23 2018-09-27 Dovetail Genomics Llc Generation of phased read-sets for genome assembly and haplotype phasing
GB201608000D0 (en) 2016-05-06 2016-06-22 Oxford Biodynamics Ltd Chromosome detection
EP3954771A1 (en) 2016-05-13 2022-02-16 Dovetail Genomics, LLC Recovering long-range linkage information from preserved samples
WO2018100381A1 (en) * 2016-12-01 2018-06-07 Oxford Biodynamics Limited Application of epigenetic chromsomal interactions in cancer diagnostics
JP7045086B2 (ja) * 2016-12-23 2022-03-31 オックスフォード バイオダイナミックス パブリック リミテッド カンパニー 分類法
US12006547B2 (en) * 2017-10-02 2024-06-11 Oxford BioDynamics PLC Detection of chromosome interactions as indicative of amyotrophic lateral sclerosis
USD877547S1 (en) 2018-07-09 2020-03-10 Apple Inc. Retail fixture
GB202111195D0 (en) 2021-08-03 2021-09-15 Cergentis B V Method for targeted sequencing
GB202111194D0 (en) 2021-08-03 2021-09-15 Cergentis B V Method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003214395A1 (en) * 2002-03-08 2003-09-22 The Babraham Institute Tagging and recovery of elements associated with target molecules
AU2008204338B2 (en) * 2007-01-11 2014-03-06 Erasmus University Medical Center Circular chromosome conformation capture (4C)

Also Published As

Publication number Publication date
US20070231817A1 (en) 2007-10-04
JP5416405B2 (ja) 2014-02-12
BRPI0611702A2 (pt) 2010-09-28
WO2007004057A2 (en) 2007-01-11
KR101383593B1 (ko) 2014-04-09
US20100075861A1 (en) 2010-03-25
AU2006264564B2 (en) 2012-04-19
US8153373B2 (en) 2012-04-10
DK1899488T3 (en) 2015-12-21
SI1899488T1 (sl) 2016-05-31
KR20080016953A (ko) 2008-02-22
IL187919A0 (en) 2008-03-20
AU2006264564A1 (en) 2007-01-11
CA2614118C (en) 2013-11-26
WO2007004057A3 (en) 2007-05-18
ES2556113T3 (es) 2016-01-13
EP1899488A2 (en) 2008-03-19
IL187919A (en) 2012-10-31
HUE026922T2 (en) 2016-07-28
PL1899488T3 (pl) 2016-03-31
RU2478716C2 (ru) 2013-04-10
JP2009500031A (ja) 2009-01-08
RU2008104024A (ru) 2009-08-10
CA2614118A1 (en) 2007-01-11
NZ564262A (en) 2010-02-26
CY1117260T1 (el) 2017-04-26
EP1899488B1 (en) 2015-09-16
NO20076430L (no) 2008-04-03

Similar Documents

Publication Publication Date Title
BRPI0611702B1 (pt) Captura e caracterização de cromatina co-localizada (4c)
BRPI0806565A2 (pt) Captura de conformação de cromossomo circular
AU2019316556B2 (en) Methods for assessing the risk of developing progressive multifocal leukoencephalopathy caused by john cunningham virus by genetic testing
CA3051544A1 (en) Methods for assessing risk of developing a viral disease using a genetic test
CN117597456A (zh) 用于确定肿瘤生长的速度的方法
CN111575380B (zh) 多基因检测用的探针库、杂交试剂盒和多基因检测的方法
CN116113436A (zh) 用于保护核酸分子的系统和方法
WO2023284736A1 (en) Biomarkers for colorectal cancer treatment
US20110110930A1 (en) Mitogen-Activated Protein Kinase Kinase Kinase 14 (MAP3K14) Polymorphisms As Indicators of Subject Outcome in Critically Ill Subjects
WO2023237122A1 (zh) Sre-ptprz1抑制剂在制备治疗鳞状细胞癌的药物中的用途
WO2023109876A1 (en) Biomarkers for colorectal cancer treatment
US20240352526A1 (en) Methods for assessing risk of developing a viral disease using a genetic test
Pinsach Abuin Regulome-seq: a novel approach for the identification of non-coding variants associated with human disease. Assessment of its applicability in 89 Brugada syndrome individuals
WO2023172501A2 (en) Methods of selecting and treating cancer subjects that are candidates for treatment using inhibitors of a pd-1 pathway
Mei et al. Circular RNA in Cardiovascular Diseases: Biogenesis, Function and Application
WO2024050437A2 (en) Methods for evaluating clonal tumor mutational burden
Sun et al. Transcript fusion between CDKN1A and RAB44 caused by exon skipping like mechanism due to disruption of a splice site

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 03/07/2006, OBSERVADAS AS CONDICOES LEGAIS.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time
B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)