ES2368767T3 - Conformación de adn (estructuras de bucle) en expresión génica normal y anormal. - Google Patents

Conformación de adn (estructuras de bucle) en expresión génica normal y anormal. Download PDF

Info

Publication number
ES2368767T3
ES2368767T3 ES07712741T ES07712741T ES2368767T3 ES 2368767 T3 ES2368767 T3 ES 2368767T3 ES 07712741 T ES07712741 T ES 07712741T ES 07712741 T ES07712741 T ES 07712741T ES 2368767 T3 ES2368767 T3 ES 2368767T3
Authority
ES
Spain
Prior art keywords
quot
weight
gene
dna
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07712741T
Other languages
English (en)
Inventor
Alexandre Akoulitchev
Aroul Selvam Ramadass
Leonid Leonidovich Nikitenko
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford University Innovation Ltd
Original Assignee
Oxford University Innovation Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford University Innovation Ltd filed Critical Oxford University Innovation Ltd
Application granted granted Critical
Publication of ES2368767T3 publication Critical patent/ES2368767T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Saccharide Compounds (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Procedimiento de diagnóstico de un cancer por detección de expresión genica anormal en un individuo que comprende determinar en una muestra del individuo la presencia de una conformación cromosómica anormal, caracterizandose dicha conformación cromosómica anormal por (i) la presencia de una nueva yuxtaposición que no esta presente durante la expresión normal, o (ii) la ausencia de al menos una yuxtaposición que esta presente durante la expresión genica normal, en el que dicha yuxtaposición es de dos regiones separadas de un gen, para asi diagnosticar si el individuo tiene cancer.

Description

Conformaci6n de ADN (estructuras de bucle) en expresi6n genica normal y anormal
Campo de la invencion
La presente invenci6n se refiere a diagn6stico y expresi6n genica.
Antecedentes de la invencion
Los procedimientos existentes de diagn6stico de enfermedad son frecuentemente insatisfactorios debido a que no esta disponible un marcador adecuado para el diagn6stico fidedigno de la enfermedad o para determinar el estado de la enfermedad. Los presentes enfoques incluyen el uso de detecci6n de proteinas, ARNm o anticuerpos.
La literatura cientifica describe la regulaci6n de la transcripci6n genica por el cambio dinamico entre bucles de genes cuasi estables formados por yuxtaposici6n de dos regiones separadas de un gen, tal como marcadores CC (vease Ramadass y col., resumen de p6ster P037, Transcription UK, Imperial College, Londres, 13-15 abril de 2005).
Compendio de la invencion
La detecci6n de proteinas, ARNm o anticuerpos no es adecuada en muchos casos de diagn6stico ya que la detecci6n de estas moleculas no representa verdaderamente la expresi6n de los genes ligados a la enfermedad. La variaci6n estocastica de niveles de expresi6n de estas moleculas entre celulas individuales es considerablemente alta, mientras que la semivida varia significativamente y podria ser muy baja, por ejemplo, aproximadamente 15 min para el polipeptido del protoncogen c-myc. Ademas, la detecci6n de estas moleculas s6lo sigue etapas posteriores en el orden de expresi6n genica - transcripci6n y traducci6n.
El ajuste conformacional epigenetico del gen para posibles rondas reiniciadas de transcripci6n y expresi6n proporciona una posibilidad de diagn6sticos en una etapa mucho mas temprana de expresi6n genica. Tales estructuras conformacionales tambien parecen ser estables, es decir, teniendo una alta semivida, que hace que sean mas faciles de detectar.
Los inventores han encontrado que el analisis de la conformaci6n cromos6mica en ADN gen6mico puede usarse para diagn6stico de enfermedad. La conformaci6n se forma por la asociaci6n o yuxtaposici6n de sitios distantes o no adyacentes en el gen. Los sitios pueden ser marcadores CC (que se tratan adicionalmente mas adelante). Se ha encontrado que un cambio en la conformaci6n cromos6mica de diferentes genes produce un cambio en la expresi6n de los genes y, por tanto, la detecci6n de la conformaci6n especifica puede usarse para detectar expresi6n anormal de un gen.
Por consiguiente, la invenci6n proporciona un procedimiento de detecci6n o diagn6stico de cancer mediante la detecci6n de expresi6n genica anormal en un individuo que comprende determinar en una muestra del individuo la presencia o ausencia de una estructura cromos6mica anormal en la que dos regiones separadas del gen se hayan puesto en estrecha proximidad por yuxtaposici6n, para asi detectar o diagnosticar si el individuo tiene expresi6n genica anormal y, por tanto, cancer.
Descripcion de los dibujos
La Fig. 1 muestra la identificaci6n de los marcadores para las unidades transcripcionales de ARNPII por el algoritmo de reconocimiento de patrones. (A) Esquema para formar y probar el modelo de marcador. 422 genes humanos anotados se muestrean, se prueban y se retroalimentan durante 103 ciclos hasta que se desarrolle un modelo convergente. En los 3' de los genes, la secuencia consenso incluy6 una senal previamente desconocida de patr6n multiplex, Checkpoint Charlie, junto con la senal de poli(A) bien definida y sitios consenso ricos en U. (B) En el extremo 3' del gen beta-globina humano, el marcador CC (marcado con distribuci6n gaussiana) esta presente en la direcci6n 3' del sitio rico en U y se corresponde con el sitio CoTC descrito mas adelante. La grafica muestra una caida en el valor de energia (marcado de gris) en el sitio CC/CoTC en relaci6n con su secuencia vecina. (C) En el cromosoma X en D. melanogaster, el marcador CC (distribuci6n gaussiana) coincide con el aislador gypsy dentro de la banda 7B2. La densidad de predicciones de CC establece una correlaci6n con sitios de uni6n a Su(Hw). Estudios anteriores muestran elementos gypsy en la banda cromos6mica 7B2 y 7B8 yuxtapuestas con formaci6n de bucle alrededor del locus cut.
La Fig. 2 muestra expresi6n regulada de los genes modelo. (A) La transcripci6n del gen hDHFR esta regulada en los promotores principal y secundario en un modo dependiente del ciclo celular. En celulas quiescentes, un transcrito corto se inicia a partir del promotor secundario en la direcci6n 5'. La citometria de flujo activada por fluorescencia (FACS) de celulas U20S se usa en los experimentos, cultivadas en presencia de 10% de SBF (1) y bajo inhibici6n de contacto en presencia de 0,5% de SBF. El porcentaje de celulas G0, G2/M, S y G1 bajo cada condici6n se muestra en los diagramas. De acuerdo con informes previos, la transferencia Northern confirma la acumulaci6n de ARNm de DHFR en celulas proliferantes (carril 3) con respecto a celulas quiescentes (carril 4). Analisis por RT-PCR en tiempo real de transcritos iniciados a partir del promotor secundario en celulas proliferantes (carril 5) y quiescentes (carril 6). Los valores mostrados se calculan a partir de tres experimentos independientes. (B) Los transcritos hCALCRL de longitud completa s6lo se producen en celulas endoteliales (HMVEC, carril 1) y no en celulas no endoteliales (HEK293T, carril 2). Los transcritos no codificantes cortos estan presentes en ambos tipos de celulas como se detecta por RACE en 3' desde el primer ex6n (carril 3, celulas endoteliales y carril 4, celulas no endoteliales). La inmunoquimica confirma que la expresi6n del receptor esta limitada in vivo a celulas endoteliales (flechas negras) y no epiteliales o del estroma (flechas blancas).
La Fig. 3 muestra propiedades de terminaci6n de los marcadores CC. (A) El gen DHFR humano contiene tres marcadores CC (triangulos s6lidos). Las propiedades de terminaci6n de la transcripci6n de los marcadores se ensayaron por RT-PCR como se representa en el esquema. Los cebadores inversos (B, C) preceden o siguen la posici6n del marcador CC probado. La RT-PCR para CCDHFR-2 se ensay6 en celulas quiescentes, ya que CCDHFR-2 mostr6 propiedades de terminaci6n reguladas s6lo bajo esas condiciones. Los perfiles para energia libre de plegamiento usando el algoritmo de Zuker muestran una caida en el valor (subrayado en gris) para los tres marcadores CC. (B) La estructura del gen CALCRL humano incluye tres marcadores CC (triangulos s6lidos). Los marcadores CC en hCALCRL (CCCALCRL-1, CCCALCRL-2 y CCCALCRL-3) tambien muestran una posible terminaci6n de la transcripci6n. Una RACE en 5' desde el primer ex6n confirma que todos los transcritos se originan en la direcci6n 3' de CCCALCRL-1, con cualquier posible transcrito intergenico satisfactoriamente terminado. La prueba de la transcripci6n terminada en CCCALCRL-2 y CCCALCRL-3 se confirm6 por RACE en 3'. El numero de accesos para los transcritos de RACE se presentan entre parentesis. En el panel inferior, las graficas muestran una caida en la energia libre de plegamiento (subrayado en gris) para cada uno de los marcadores CC de hCALCRL.
La Fig. 4 muestra las propiedades de conformaci6n cromos6mica de marcadores CC. (A) El ensayo 3C integrado se realiz6 para los sitios CC en el gen hDHFR bajo condiciones proliferantes y quiescentes. Los controles indican dependencia completa del ensayo en la reticulaci6n, restricci6n, ligaci6n, PCR y enriquecimiento de ARNPII por inmunoprecipitaci6n. En celulas proliferantes se detecta una proximidad espacial entre CCDHFR-1 y CCDHFR-3 (carril 1+3), pero no entre los sitios CCDHFR-1 y CCDHFR-2 (carril 1+2) dentro del gen hDHFR. En celulas quiescentes, la proximidad espacial tambien se detecta entre los sitios CCDHFR-1 y CCDHFR-2 (carril 1+2). Ilustraci6n esquematica de posibles conformaciones detectadas por el ensayo 3C bajo condiciones probadas. (B) El ensayo 3C integrado se realiz6 para los sitios CC en el gen hCALCRL en lineas de celulas endoteliales y no endoteliales. Los controles indican dependencia completa del ensayo en la reticulaci6n, restricci6n, ligaci6n, PCR y enriquecimiento por inmunoprecipitaci6n. En celulas endoteliales se detect6 una interacci6n entre CCCALCRL-1, CCCALCRL-2 y CCCALCRL-3 que indica una conformaci6n que yuxtapone todos los marcadores (carriles 1+2 y 1+3, vease el esquema). En celulas no endoteliales s6lo pudo detectarse una interacci6n entre CCCALCRL-1 y CCCALCRL-2 (carril 1+2, vease el esquema), siendo la interacci6n entre CCCALCRL-1 y CCCALCRL-3 unica para la transcripci6n productiva de longitud completa en celulas endoteliales.
La Fig. 5 muestra las predicciones de Checkpoint Charlie en otros organismos. El modelo estudiado en 422 genes humanos identifica marcadores CC (triangulos rojos) en otras especies. 0bservese que en el caso de RGF3 un unico marcador CC separa dos genes anotados, que sirve de marcador de 3' para un gen y marcador de 5' para otro. Los exones e intrones se dibujan como rectangulos verdes y grises, respectivamente. La linea continua representa secuencias intergenicas.
La Fig. 6 muestra los principios de la detecci6n de la conformaci6n cromos6mica usando el ensayo 3C.
La Fig. 7 muestra el tipado de c-myc para diagnosticar cancer renal. Los marcadores CC 1 y 2 estan posicionados alrededor del promotor P0. La yuxtaposici6n de CC1-CC2 conduce a la formaci6n de la estructura cerrada que aisla P0 y evita la iniciaci6n de P0, pero no de P1.2. El analisis de la yuxtaposici6n conformacional CC1-CC2 en muestras de tejido muestra la presencia de producto de PCR especifico, confirmando la conformaci6n existente en pacientes con tumor renal (T1-3), pero no en tejidos normales (N1-3). Todas las muestras se probaron independientemente para la presencia de conformaci6n estable en genes sin relacionar, receptor similar al receptor de calcitonina (CRLR). Esta conformaci6n esta presente en todos los tejidos y actua de control interno para el ensayo (marcado como control).
La Fig. 8 muestra el perfilado de la conformaci6n cromos6mica de cancer de ovario con MLH1.
La Fig. 9 muestra la desregulaci6n conformacional en lineas celulares de pr6stata.
Descripcion detallada de la invencion
La invenci6n proporciona un procedimiento para la detecci6n de expresi6n anormal de un gen basandose en la determinaci6n de la estructura tridimensional de mayor orden que ha adoptado el gen, y en particular basandose en la posici6n/patr6n de sitios asociados/yuxtapuestos dentro del gen. El procedimiento puede detectar la presencia o ausencia de sitios yuxtapuestos, o una conformaci6n cromos6mica producida por tal yuxtaposici6n, en una o mas localizaciones en el gen. La forma normal de expresi6n de un gen se define normalmente como la expresi6n de un producto (ARN o polipeptido) en una forma y/o cantidad que permite que el producto realice su funci6n celular/fisiol6gica.
La expresi6n anormal puede definirse como un modo de expresi6n en el que se realiza un producto diferente (normalmente debido a un cambio en la posici6n de la terminaci6n de la transcripci6n) y/o la cantidad de producto se expresa a un nivel alterado (o incluso no se expresa en absoluto). La expresi6n anormal puede conducir a un estado de enfermedad en el organismo (tal como cualquiera de las enfermedades mencionadas en este documento), y normalmente conducira a una alteraci6n de la viabilidad y/o funcionamiento de la celula o tejido u 6rgano en el que se produce la expresi6n anormal. La expresi6n anormal se caracteriza normalmente por la expresi6n de ARN o proteina de longitud aumentada o reducida en comparaci6n con el producto normal y/o la expresi6n de ARN o proteina a un nivel aumentado o reducido en comparaci6n con niveles de expresi6n normales.
En una realizaci6n preferida, el cambio de expresi6n normal a anormal se produce debido a un cambio en la estructura cromos6mica como se define por marcadores CC. La yuxtaposici6n estructural de marcadores CC normalmente define la frontera de las unidades de transcripci6n, y generalmente la expresi6n anormal impone en exceso fronteras aberrantes (diferentes) a las observadas en expresi6n normal.
La invenci6n proporciona el diagn6stico de una condici6n de enfermedad o diagn6stico de la etapa de una enfermedad en un individuo. La enfermedad es normalmente una en la que se produce la expresi6n anormal de uno
o mas genes. Tal expresi6n anormal puede producir o contribuir a la enfermedad. El gen puede ser uno que expresa un polipeptido funcional o ARN que no esta traducido (tal como genes de ARN no codificantes y pseudogenes). El gen puede expresar ARN que tiene una funci6n reguladora.
El gen es preferentemente un protoncogen (tal como c-myc) o un gen supresor de tumores (tal como BRCA1). El gen puede ser cualquiera de los genes enumerados en la Tabla 2. El gen puede ser hDHFR, hCALCRL, MLH1, PSA
o B0RIS (por ejemplo, como se desvela en los nO de acceso de GenBank NM000791, NM005795, NM000249, NM001030047 o NM080618). El gen tiene normalmente 2, 3, 4 o mas secuencias de marcadores CC. El gen puede comprender un marcador CC en un intr6n proximal al promotor, normalmente en el primer intr6n.
La enfermedad puede ser un cancer tal como un cancer renal, de ovario, de vejiga, de colon o de pr6stata. La enfermedad puede ser una enfermedad genetica, normalmente producida por expresi6n de un ARN o producto de polipeptido alterado (como se define anteriormente) y/o producida por la expresi6n de un nivel diferente de ARN o producto de polipeptido (tal como la ausencia de expresi6n de un producto tal).
En una realizaci6n, el procedimiento se lleva a cabo para determinar la etapa de la enfermedad, particularmente en el caso en el que la enfermedad sea cancer. El procedimiento puede llevarse a cabo para determinar el riesgo de progresi6n de cancer. Por tanto, el procedimiento puede usarse para predecir la tasa o gravedad de tumor o progresi6n de la enfermedad.
El individuo en el que se realiza el diagn6stico
El individuo que va a diagnosticarse puede tener uno o mas sintomas de cualquiera de las condiciones de enfermedad mencionadas en este documento y/o del que se sospecha que tiene una condici6n de enfermedad tal. El individuo puede estar en riesgo de cualquier condici6n de enfermedad tal, por ejemplo, debido a que tiene un antecedente familiar de la enfermedad o debido a que vive en un entorno que produce o contribuye al desarrollo de la enfermedad. En el caso de cancer en un ser humano, el individuo puede tener mas de 40 anos, tal como mas de 50, o mas de 60 anos de edad. El individuo puede tener antecedentes de tabaquismo.
El individuo puede ser uno que tiene marcadores CC (cuya asociaci6n define la estructura cromos6mica) en al menos un gen de su genoma. El individuo es normalmente un eucariota, tal como un eucariota inferior o superior. El individuo puede ser una planta, levadura, insecto, marsupial, ave o mamifero. El individuo es preferentemente un mamifero, tal como un primate, ser humano o roedor.
Diagn6stico
La presente invenci6n proporciona un procedimiento de diagn6stico de expresi6n genica anormal y, por tanto, un procedimiento de diagn6stico de condiciones de enfermedad particulares. El procedimiento comprende la detecci6n de si hay o no una conformaci6n cromos6mica anormal en el ADN del individuo (por ejemplo, tanto directamente por detecci6n de la estructura cromos6mica real como indirectamente por detecci6n de los sitios de asociaci6n/yuxtaposici6n en el gen). Una conformaci6n anormal tal comprendera generalmente la presencia de una nueva yuxtaposici6n (o una combinaci6n de yuxtaposiciones) en sitios en un gen (en los que normalmente no se observan, por ejemplo, cuando el gen se esta normalmente expresando) o la ausencia de una o mas yuxtaposiciones (que se observan normalmente durante la expresi6n normal). Como se menciona anteriormente, la conformaci6n anormal conducira a que el gen exprese transcrito de ARN con una diferencia en la secuencia y/o funci6n y/o cantidad, y la diferencia en la expresi6n puede producir o contribuir a una enfermedad en el individuo, tal como cancer. La conformaci6n cromos6mica anormal puede producir la expresi6n de una variante de corte y empalme diferente.
Puede usarse cualquier medio adecuado para detectar/examinar la conformaci6n cromos6mica del ADN que se analiza. Normalmente, la detecci6n determinara la posici6n de al menos una estructura similar a bucle en el ADN del individuo. En una realizaci6n, el procedimiento puede comprender determinar la presencia o ausencia de un par yuxtapuesto dado de marcadores CC, permitiendo asi, por ejemplo, la deducci6n de que la conformaci6n observada es diferente de la normal.
Normalmente, el procedimiento se lleva a cabo in vitro en una muestra del individuo. La muestra comprendera ADN del individuo en un estado en el que las regiones del genoma que estan asociadas en el estado natural permanezcan asociadas en la muestra (es decir, se preserva el estado cromos6mico epigenetico), por ejemplo, para regiones asociadas que estan separadas menos de 5 kb, 3 kb, 1 kb, 500 pares de bases o 200 pares de bases. La muestra comprendera normalmente celulas del individuo. La muestra comprendera generalmente celulas de un tejido que participa en la enfermedad que va a diagnosticarse. La muestra comprende normalmente un fluido corporal del individuo y puede obtenerse, por ejemplo, usando un hisopo tal como un hisopo bucal. La muestra es preferentemente una muestra de sangre o una muestra congelada. La muestra puede ser una biopsia, tal como de un tumor. El procedimiento puede llevarse a cabo en una unica celula del individuo.
La muestra se procesa normalmente antes de llevarse a cabo el procedimiento, por ejemplo, puede llevarse a cabo la extracci6n de ADN. El ADN en la muestra puede escindirse tanto fisicamente como quimicamente (por ejemplo, usando una enzima adecuada). En una realizaci6n se usa anticuerpo especifico para ARN polimerasa II para separar el ADN de otros componentes de la celula.
La conformaci6n cromos6mica puede detectarse por determinaci6n de las secuencias que estan asociadas, por ejemplo, que forman la base de una estructura similar a bucle. En una realizaci6n preferida, el ADN se somete a reticulaci6n antes de una determinaci6n tal. La reticulaci6n comprendera generalmente un enlace covalentemente ligado a la forma, y generalmente se forma poniendose en contacto con un agente que produce reticulaci6n. Un agente tal puede ser un aldehido, tal como para-formaldehido, o ester de N-hidroxisuccinimida de acido D-biotinoil-εaminocaproico o ester de N-hidroxisuccinimida de acido digoxigenin-3-0-metilcarbonil-ε-aminocaproico. El paraformaldehido puede reticularse con las cadenas de ADN que estan separadas 4 Angstroms.
En el procedimiento, el sitio de la yuxtaposici6n puede establecerse por determinaci6n de las secuencias que se ponen en estrecha proximidad por la formaci6n del bucle. Una determinaci6n tal puede llevarse a cabo por cualquier medio adecuado, y en una realizaci6n preferida se realiza usando PCR.
En una realizaci6n, el ensayo de captura de la conformaci6n cromos6mica se usa, por ejemplo, como se describen en Dekker y col. (2002) Science 295, 1306. En este ensayo, el ADN se reticula (por ejemplo, como se ha descrito anteriormente). Entonces, el ADN reticulado se corta, normalmente por digesti6n con restricci6n, y la estructura cortada/digerida se somete a ligaci6n. La ligaci6n producira los extremos de las cadenas de ADN que se formaron por corte/digesti6n para ligarse juntos. Por tanto, la ligaci6n producira generalmente ADN con una nueva secuencia (que no estaba presente en el gen original) que incluye ambas secuencias de los sitios yuxtapuestos. La detecci6n de la nueva secuencia puede usarse como la base de la detecci6n de la conformaci6n (es decir, para detectar la presencia de yuxtaposici6n en una posici6n particular).
La secuencia generada por ligaci6n puede detectarse por cualquier medio adecuado. Normalmente se detecta basandose en su secuencia, por ejemplo, usando PCR. En una realizaci6n se usa una reacci6n de detecci6n por PCR en la que cebadores de PCR que se usan se unen en cualquier lado del punto de ligaci6n y producen una reacci6n de PCR satisfactoria en presencia del producto ligado, pero que no producen una reacci6n de PCR satisfactoria cuando se lleva a cabo en presencia de un gen que no tiene la estructura relevante (normalmente debido a que los cebadores estan unidos demasiado alejados entre si en la secuencia del gen y la orientaci6n de los cebadores excluye la elecci6n de otros productos (los cebadores se eligen en la misma orientaci6n con el fin de prevenir productos aberrantes)). En esta realizaci6n, un producto de PCR no s6lo se detectara en presencia del producto ligado (vease la Figura 1). Normalmente, los cebadores de PCR se uniran dentro de 500 pares de bases entre si cuando se unan al producto ligado.
La secuencia ligada puede detectarse/analizarse por PCR especifica de secuencia o por secuenciaci6n directa. La detecci6n puede realizarse usando un sistema basado en gel en el que la secuencia ligada se ejecuta en un gel, y luego el gel se tine con un compuesto detectable que se une a polinucle6tidos. La secuencia ligada puede detectarse usando una sonda, tal como una sonda de polinucle6tidos que se une especificamente a la secuencia ligada.
Los productos de PCR que se forman en las reacciones de PCR mencionadas anteriormente pueden detectarse por cualquier medio adecuado, por ejemplo, por cualquier procedimiento adecuado de entre los procedimientos mencionados anteriormente para la detecci6n del producto ligado.
En una realizaci6n, el procedimiento tambien comprende detectar la estructura cromos6mica de otro gen, que es un gen especifico de tejido. La detecci6n de la estructura del gen adicional (por ejemplo, por cualquiera de los medios descritos en este documento) permitira la determinaci6n de si el gen adicional esta siendo expresado o no y, por tanto, permitira la determinaci6n de la especificidad de tejido de la expresi6n. Esto puede ayudar en el diagn6stico de la enfermedad.
En una realizaci6n de la invenci6n, 2, 3 o mas genes se analizan con el fin de ayudar en el diagn6stico. En particular, en el caso de diagn6stico de cancer, el analisis de mas de un gen que participa en provocar canceres puede ayudar en la determinaci6n del cancer especifico.
En otra realizaci6n, el analisis de la estructura cromos6mica que se lleva a cabo segun el procedimiento de la invenci6n se compara con el mismo analisis llevado a cabo en una biopsia de control de tejido con enfermedad (tal como un cancer/tumor) con el fin de ayudar en el diagn6stico.
En una realizaci6n, el procedimiento de la invenci6n se lleva a cabo de un modo cuantitativo con el fin de determinar la proporci6n de celulas del individuo (por ejemplo, en una localizaci6n in vivo particular o en un tejido particular) que tienen una expresi6n genica anormal. Esto puede ayudar en la determinaci6n de la etapa de una enfermedad.
Secuencias en el gen que se asocian para formar la estructura cromos6mica
Como se ha mencionado en este documento, el procedimiento de la invenci6n comprende detectar la presencia de una conformaci6n cromos6mica que se forma por asociaci6n de regiones particulares de un gen. Tales regiones estan en el mismo cromosoma, y normalmente estan separadas menos de 50.000, tal como menos de 20.000, 10.000, 5000, 1000 o menos de 500 bases. La asociaci6n de las secuencias puede hacer que se forme una estructura de bucle/similar a bucle/topol6gicamente cerrada. El experto reconocera lo que se indica por referencia a regiones de un gen que estan asociadas. Tales regiones estan suficientemente pr6ximas para reticularse juntas, tal como por cualquiera de los agentes de reticulaci6n mencionados en este documento. Por tanto, normalmente estaran separadas una distancia que es del orden de Angstroms, tal como por ejemplo menos 50 Angstroms o menos de 10 Angstroms.
Una o ambas de las secuencias que se asocian pueden:
-
causar, regular o contribuir a la terminaci6n de la transcripci6n, y/o
-
ser marcadores CC.
El marcador CC normalmente tiene una longitud de 1 a 30 bases de nucle6tidos, por ejemplo, 5 a 20 6 10 a 15 bases.
Los marcadores CC pueden detectarse en cualquier secuencia de genes dada usando la informaci6n en la Tabla 1. Una de las secciones posteriores ilustra mas adelante en detalle c6mo se identifican secuencias del marcador CC. Sigue una breve descripci6n de c6mo se usa la informaci6n en la Tabla 1: la tabla muestra 4 conjuntos de pesos. Para cada conjunto de pesos se indica una posici6n, y los valores de posici6n para cada tipo de nucle6tido se facilitan con referencia a la posici6n inicial (en la Tabla 1 esto se define como la posici6n de columna que esta en referencia con la posici6n inicial). Como puede apreciarse, para el primer conjunto de peso, los valores para guanina, citosina, adenina y timina se facilitan para las posiciones 0 a 18. Usando los valores en la Tabla 1 se determina una puntuaci6n para cada base de una secuencia dada en la cadena directa e inversa. Este analisis se hace escaneando la secuencia de izquierda a derecha y luego repitiendolo en su hebra complementaria. Mientras se escanea, una base se considera como punto de referencia y la puntuaci6n para esa base se determina usando los valores de posici6n de los 4 conjuntos de pesos y la distancia relativa entre los pesos (es decir, para cada base se determina una puntuaci6n basandose en las secuencias alrededor de esa base cuyas posiciones se definen usando los numeros de posici6n en la Tabla 1). Si esta puntuaci6n es mayor que X (valor de entrada dado por el usuario), entonces el par de bases en cuesti6n esta dentro de un marcador CC. Este procedimiento se repite para todas las bases.
La puntuaci6n se convierte normalmente en una puntuaci6n (logaritmica inversa) de valor exponencial. En una realizaci6n se seleccionan marcadores CC que tienen una puntuaci6n logaritmica inversa superior a 0,9, tal como superior a 0,95 o superior a 0,99 (el calculo de la puntuaci6n logaritmica se describe en mas detalle en una secci6n posterior).
Los inventores han usado la informaci6n en la Tabla 1 para detectar marcadores CC en ser humano, levadura y mosca de la fruta (secuencias de D. melanogaster).
Kit para llevar a cabo el procedimiento
La invenci6n tambien proporciona un kit para llevar a cabo el procedimiento. El kit comprendera normalmente un medio para la detecci6n de secuencias yuxtapuestas especificas en un gen. Normalmente, el kit comprendera un primer par o sonda que puede usarse para detectar una secuencia yuxtapuesta (por ejemplo, detectando un producto ligado como se describe en este documento). Normalmente, uno o ambos cebadores y/o la sonda comprenderan la secuencia que es un fragmento de la secuencia del gen o de la secuencia que es hom6loga a la secuencia del gen (se entiende que referencias a la secuencia del gen tambien incluyen la secuencia complementaria, ya que por supuesto un cebador se unira a la secuencia del gen y el otro cebador se unira a la secuencia complementaria). Tal secuencia del gen puede estar en 5' con respecto a la secuencia codificante (por ejemplo, secuencia promotora), secuencia codificante, secuencia de intr6n o secuencia 3' con respecto a la secuencia codificante.
Los cebadores o sonda tienen normalmente al menos 10, 15, 20, 30 o mas bases de longitud, y generalmente comprenden ADN, normalmente en forma monocatenaria. Los cebadores o sondas pueden estar presentes en forma aislada. Los cebadores o sonda pueden llevar una marca reveladora/detectable. Marcas adecuadas incluyen radiois6topos tales como 32P o 35S, marcas fluorescentes, marcas enzimaticas u otras marcas de proteina tales como biotina.
El kit puede comprender instrucciones para realizar el procedimiento de la invenci6n. El kit puede comprender un agente de reticulaci6n que puede reticular el ADN, tal como cualquiera de los agentes de reticulaci6n mencionados en este documento.
En una realizaci6n, el kit es para llevar a cabo realizaciones de la invenci6n en las que se analiza la estructura cromos6mica de mas de un gen, tal como 2, 3, 4 o mas genes. En tales casos, el kit tambien puede comprender cebadores o sondas para analizar 2, 3, 4 o mas genes diferentes.
El kit puede comprender adicionalmente uno o varios reactivos o instrumentos que permiten que se lleve a cabo cualquiera de las realizaciones del procedimiento mencionadas anteriormente. Tales reactivos o instrumentos incluyen uno o mas de los siguientes: una marca detectable (tal como una marca fluorescente), una enzima que puede actuar sobre un polinucle6tido (normalmente una polimerasa, enzima de restricci6n, ligasa, RNAsa H o una enzima que pueda unir una marca a un polinucle6tido), tamp6n (tampones) adecuado(s) (disoluciones acuosas) para reactivos enzimaticos, un control positivo y/o negativo, un aparato de electroforesis en gel, un medio para aislar ADN de la muestra, un medio para obtener una muestra del individuo (tal como un hisopo o un instrumento que comprende una aguja) o un soporte que comprende pocillos sobre los que pueden hacerse las reacciones de detecci6n.
Procedimiento de cribado
La invenci6n proporciona un procedimiento de identificaci6n de un compuesto para tratar expresi6n anormal de un gen que comprende determinar si una sustancia candidata puede hacer que la estructura cromos6mica del gen cambie de la estructura anormal que se adopta durante la expresi6n anormal a la estructura normal para asi determinar si la sustancia candidata puede ser capaz de tratar expresi6n anormal. El cambio en la estructura cromos6mica puede detectarse usando cualquier procedimiento adecuado descrito en este documento. El procedimiento tambien puede llevarse a cabo para identificar compuestos que pueden causar un cambio en la expresi6n de un gen (por ejemplo, un cambio de un modo de expresi6n a otro modo de expresi6n), determinando de nuevo si un compuesto candidato puede producir o no un cambio en la estructura del gen.
El procedimiento puede llevarse a cabo in vitro (dentro o fuera de una celula) o in vivo (con un organismo no humano). En una realizaci6n, el procedimiento se lleva a cabo en una celula, cultivo celular, extracto celular, tejido, 6rgano u organismo que comprende el gen. La celula es normalmente una en la que se observa expresi6n anormal del gen.
El procedimiento se lleva a cabo normalmente poniendo en contacto (o administrando) la sustancia candidata con el gen, celula, cultivo celular, extracto celular, tejido, 6rgano u organismo y determinar si se produce o no un cambio a la estructura cromos6mica normal.
Sustancias candidatas adecuadas que se probaron en los procedimientos de cribado anteriores incluyen agentes de anticuerpo (por ejemplo, anticuerpos monoclonales y policlonales, anticuerpos monocatenarios, anticuerpos quimericos y anticuerpos injertados en CDR). Ademas, tambien pueden probarse bibliotecas combinatorias, entidades quimicas definidas, peptido y mimeticos de peptidos, oligonucle6tidos y bibliotecas de agentes naturales tales como bibliotecas de expresi6n (por ejemplo, bibliotecas de expresi6n en fago). Las sustancias candidatas pueden ser compuestos quimicos que se derivan normalmente de la sintesis alrededor de moleculas pequenas que pueden tener cualquiera de las propiedades del agente mencionado en este documento (tal como los compuestos organicos mencionados en este documento). Los lotes de las sustancias candidatas pueden usarse en un cribado inicial de, por ejemplo, diez sustancias por reacci6n, y las sustancias de lotes que muestran modulaci6n se prueban individualmente.
Genes y organismos manipulados por ingenieria
La invenci6n proporciona un procedimiento de cambio del perfil de expresi6n de un gen que comprende
(i)
introducir un marcador CC en el gen, y/o
(ii)
eliminar un marcador CC del gen, opcionalmente introduciendo 1, 2, 3 o mas mutaciones en el marcador CC, en el que cada mutaci6n es una adici6n, sustituci6n o deleci6n de una base de nucle6tidos,
en el que al menos el 50% de la secuencia codificante del gen permanece invariable en el procedimiento.
En una realizaci6n, el numero total de secuencias de marcador CC (es decir, secuencias de marcador CC funcionales) permanece invariable en el procedimiento.
Por "eliminar un marcador CC" se entiende que la secuencia del marcador CC entera puede no necesitar eliminarse, pero en su lugar pueden introducirse mutaciones en la secuencia del marcador CC para inactivarla, de manera que en una realizaci6n la secuencia del marcador CC alterada ya no puede producir asociaci6n de regiones del gen.
El ARN o producto de polipeptido del gen retiene la actividad funcional o puede tener una actividad diferente o puede no tener actividad (en comparaci6n con el producto del gen no manipulado por ingenieria). El gen manipulado por ingenieria puede ser cualquiera de los genes mencionados en este documento. El gen manipulado por ingenieria puede replicarse y/o expresarse y/o introducirse en una celula.
La invenci6n proporciona el uso de un polinucle6tido que comprende un marcador CC para cambiar la expresi6n de un gen. Un polinucle6tido tal puede usarse para introducir o eliminar un marcador CC de un gen, como en el caso de cualquiera de los genes manipulados por ingenieria descritos en este documento. El polinucle6tido es normalmente una molecula de ADN. El polinucle6tido puede estar en forma de un vector, tal como un vector virico. El polinucle6tido puede estar en forma de un transpos6n.
La invenci6n tambien proporciona un organismo eucariota manipulado por ingenieria no humano que comprende al menos un gen en su genoma cuyo perfil de expresi6n se ha cambiado por la introducci6n y/o eliminaci6n de una secuencia del marcador CC, en el que al menos el 50% de la secuencia codificante del gen permanece invariable. Por tanto, el organismo puede comprender el gen manipulado por ingenieria de la invenci6n que se ha descrito anteriormente. El organismo (transgenico) puede ser cualquiera de los organismos mencionados en este documento. La invenci6n tambien proporciona una parte del organismo que comprende el gen manipulado por ingenieria, tal como una celula u 6rgano del organismo.
La invenci6n proporciona un procedimiento de preparar el organismo manipulado por ingenieria de la invenci6n que comprende introducir o eliminar un marcador CC en un gen en la celula del organismo, y en el caso de un organismo multicelular, permitir que la celula crezca en el organismo. La introducci6n o eliminaci6n del marcador CC puede llevarse a cabo en una celula germinal o citoblasto de embri6n.
Hom6logos
En este documento se citan hom6logos de secuencias de polinucle6tidos. Tales hom6logos tienen normalmente al menos el 70% de homologia, preferentemente al menos el 80, 90%, 95%, 97% o el 99% de homologia, por ejemplo, con respecto a una regi6n de al menos 15, 20, 30, 100 o mas nucle6tidos contiguos. La homologia puede calcularse basandose en la identidad de nucle6tidos (denominada algunas veces en lo sucesivo "homologia dura").
Por ejemplo, el paquete UWGCG proporciona el programa BESTFIT que puede usarse para calcular homologia (por ejemplo, usado en sus parametros por defecto) (Devereux y col. (1984) Nucleic Acids Research 12, pag. 387-395). Los algoritmos PILEUP y BLAST pueden usarse para calcular homologia o alinear secuencias (tal como identificar secuencias equivalentes o correspondientes (normalmente en sus parametros por defecto), por ejemplo, como se describe en Altschul S. F. (1993) J Mol Evol 36:290-300; Altschul, S, F y col. (1990) J Mol Biol 215:403-10.
El software para realizar los analisis por BLAST esta publicamente disponible del Centro nacional para informaci6n biotecnol6gica (http://www.ncbi.nlm.nih.gov/). Este algoritmo implica identificar primero el par de secuencias de alta puntuaci6n (HSP) identificando palabras cortas de longitud W en la secuencia de busqueda que tanto coinciden como satisfacen alguna puntuaci6n T umbral de valor positivo cuando se alinean con una palabra de la misma longitud en una secuencia de la base de datos. T se denomina en lo sucesivo al umbral de puntuaci6n de palabras vecinas (Altschul y col., antes). Estas palabras comunes vecinas iniciales actuan de semillas para iniciar busquedas para encontrar HSP que las contienen. Las palabras comunes se extienden en ambas direcciones a lo largo de cada secuencia para poder aumentar en la medida de lo posible la puntuaci6n de alineamiento acumulado. Las extensiones para las palabras comunes en cada direcci6n se detienen cuando: las puntuaciones de alineamiento acumuladas se encuentran fuera de la cantidad X de su maximo valor alcanzado; la puntuaci6n acumulada tiende a cero o por debajo, debido a la acumulaci6n de uno o mas alineamientos de residuos de puntuaci6n acumulada; o se alcanza el extremo de cualquier secuencia. Los parametros W, T y X del algoritmo BLAST determinan la sensibilidad y la velocidad del alineamiento. El programa BLAST usa por defecto una longitud de palabra (W) de 11, los alineamientos de la matriz de puntuaci6n BL0SUM62 (vease Henikoff y Henikoff (1992) Proc. Natl. Acad. Sci. USA
89: 10915-10919) (B) de 50, esperanza (E) de 10, M=5, N=4, y una comparaci6n de ambas cadenas.
El algoritmo BLAST realiza un analisis estadistico de la similitud entre dos secuencias; vease, por ejemplo, Karlin y Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5787. Una medida de la similitud proporcionada por el algoritmo BLAST es la probabilidad de suma minima (P(N)) que proporciona una indicaci6n de la probabilidad de que se produzca por casualidad una coincidencia entre dos secuencias de polinucle6tidos. Por ejemplo, una secuencia se considera similar a otra secuencia si la probabilidad de suma minima en la comparaci6n de la primera secuencia con la segunda secuencia es inferior a aproximadamente 1, preferentemente inferior a aproximadamente 0,1, mas preferentemente inferior a aproximadamente 0,01, y lo mas preferentemente inferior a aproximadamente 0,001.
La secuencia hom6loga normalmente se diferencia menos de 2, 3, 5 u 8 bases (que pueden ser sustituciones, deleciones o inserciones de nucle6tidos). Estos cambios pueden medirse a traves de cualquiera de las regiones mencionadas anteriormente en relaci6n con el calculo de homologia.
Los siguientes ejemplos ilustran la invenci6n:
Uso de analisis de reconocimiento de patrones para investigar la organizaci6n estructural de genes
Un paradigma emergente de la biologia eucariota es que los aspectos estructurales de la organizaci6n nuclear desempenan una funci6n directa en la regulaci6n transcripcional de los genes. A partir de los territorios cromos6micos para bucles de genes -diversos niveles estructurales emergen como componentes importantes de respuestas transcripcionales especificas (1-3). Aqui, los inventores han combinado dos enfoques con el fin de identificar algunas de las propiedades implicadas en la organizaci6n estructural de genes transcritos in vivo. A partir de las matematicas aplicadas, los inventores han empleado analisis de reconocimiento de patrones basandose en el modelo lineal generalizado y el teorema de Bayes, y lo han usado para identificar los limites de las unidades transcripcionales de ARN polimerasa II (ARNPII). A partir de biologia molecular, los inventores han usado ensayos in vivo para analizar y describir el espectro de actividad transcripcional y la organizaci6n del dominio subcromos6mico estructural en esos sitios.
El analisis de reconocimiento de patrones se ha aplicado ampliamente a diversos campos de estudio tales como medicina, ingenieria y lingOistica en los que el analisis de imagenes y la descodificaci6n de datos permiten la identificaci6n de marcadores caracteristicos subyacentes dentro de sistemas complejos. Los inventores han usado metodologia de reconocimiento de patrones para analizar datos de genoma humano en relaci6n con las unidades transcripcionales, procesadas por ARNPII. Se us6 un conjunto de secuencias de 422 genes manualmente anotados en el cromosoma humano 22 (4) para la identificaci6n computacional de senales reguladoras. Para el estudio dado, de todos los procedimientos disponibles para el reconocimiento de patrones, los inventores encontraron la maquina de vectores de relevancia (RVM) (5-6) como la mas satisfactoria. El entrenador de RVM aplica un principio bayesiano escaso que contiene la variaci6n de distancia observada entre las senales reguladoras (7). Del conjunto dado de secuencias, el entrenador escanea marcadores que las definen y construye un modelo lineal generalizado probabilistico. Este modelo "estudiado" puede usarse posteriormente para clasificar secuencias de elecci6n para la presencia de los marcadores definidos. La derivaci6n de este modelo se basa en la probabilidad condicional del teorema de Bayes facilitado a continuaci6n:
P(modelo \ datos)P(modelo)P(modelo \ datos) P(datos)
en la que datos representa el conjunto de secuencias de ADN. P(modeloldatos) es la probabilidad posterior que da la probabilidad de una secuencia derivada del modelo. Depende de la probabilidad de los datos dado el modelo y las probabilidades del modelo y los datos.
Cada marcador que define la caracteristica de la secuencia, x, se facilita como una matriz de pesos de ADN con respecto al sitio de escisi6n. Matematicamente se representa como:
п
φ(x) = вP(i)W(x,i)
i=-п
en la que P es una probabilidad posicional y W(x,i) es una probabilidad de matriz de pesos de ADN para una compensaci6n de i con respecto al sitio de escisi6n. Entonces se usa una combinaci6n de estos marcadores para construir un modelo lineal generalizado:
M
Modelo = вβφ (x) + k
mm
m=!
en la que M es el conjunto de marcadores que definen el gen y f es los pesos (o importancia) dada de cada marcador.
El modelo estudiado en 422 genes humanos anotados del cromosoma 22 identific6 tres tipos de marcadores generales en los extremos 3' (Fig. 1A). Senales de terminaci6n de la transcripci6n previamente conocidas: senal de poli(A) y sitio rico en U pr6ximo a los extremos 3' de genes transcritos con ARNPII son dos de los tres tipos de marcadores identificados. Este resultado valid6 en enfoque de los inventores ya que confirm6 inequivocamente secuencias ya descritas funcionalmente implicadas en la terminaci6n y el procesamiento del extremo 3' de ARNm (810). Interesantemente, el tercer tipo de marcador identificado por el entrenador de RVM fue previamente desconocido. Se posicion6 adicionalmente en la direcci6n 3' del sitio rico en U y comprendi6 multiples matrices de pesos de ADN. La variaci6n de distancia observada en cada tipo de los marcadores fue capturada como una distribuci6n gaussiana. Interesantemente, cuando se prueba el modelo en 20 secuencias del cromosoma humano, el marcador no se confin6 a los extremos 3', sino que tambien estuvo presente en los extremos 5' de genes anotados. Debido a la asociaci6n del marcador recientemente definido con las fronteras de las unidades transcripcionales, los inventores lo han llamado segun el famoso muro de Berlin de los tiempos de la guerra fria - un marcador Checkpoint Charlie (CC).
Interesantemente, a diferencia del sitio poli(A), los inventores fueron incapaces de identificar alguna secuencia consenso primaria para los marcadores CC. Esto sugiere que mediante el analisis de reconocimiento de patrones los inventores han identificado los sitios que podrian compartir propiedades comunes mediante la informaci6n codificada en las estructuras secundarias y terciarias de las secuencias correspondientes. De hecho, el analisis de secuencias de marcadores CC usando el algoritmo Zuker de (11) revela energias libres bajas de plegamiento, caracteristicas de estructuras secundarias y terciarias de alto orden para los transcritos correspondientes.
Para determinar la relevancia funcional de los marcadores CC para la regulaci6n transcripcional, los inventores buscaron cualquier ejemplo de marcadores CC entre elementos reguladores ya definidos. Es importante mencionar que el algoritmo estudiado en genes humanos pudo identificar marcadores CC en eucariotas a traves de muchas especies (Fig. 5). Los inventores atribuyeron esto a la funci6n evolutivamente conservada mediada por las estructuras de alto orden del marcador.
Aqui, los inventores presentan dos ejemplos de los marcadores CC funcionalmente asociados a regulaci6n transcripcional. El primer ejemplo del marcador CC se encontr6 dentro del gen beta-globina humano, estudiado ampliamente por sus propiedades por varios laboratorios. Informes recientes demostraron que la terminaci6n de la transcripci6n en el gen beta-globina depende no s6lo del reconocimiento del sitio poli(A), sino tambien del sitio de escisi6n (CoTC) co-transcripcional adicional en la direcci6n 3' (7, 12-14). Interesantemente, el sitio CoTC coincide con el marcador CC identificado y muestra bajas energias de plegamiento, como se menciona antes (Fig. 1B). Esta observaci6n no s6lo confirma la posible relevancia del marcador CC para la frontera del gen transcrito, sino que tambien sugiere su implicaci6n funcional en el mecanismo de terminaci6n transcripcional regulada.
El segundo ejemplo del marcador CC se encontr6 en el cromosoma X de Drosophila melanogaster, en el que coincidi6 con el aislador gypsy dentro de la banda cromos6mica 7B2 (Fig. 1C). Gypsy es un elemento aislador de 350 pb bien caracterizado con multiples sitios de uni6n Su(Hw), que dirigen estructuras similares a bucle de cromatina de orden superior (15). Un experimento hecho en el locus cut en Drosophila mostr6 que los dos sitios del aislador en las bandas cromos6micas 7B2 y 7B8 se ponen juntos en la periferia nuclear haciendo un bucle entre los loci (16) (Fig. 1C). Tambien se ha mostrado una organizaci6n similar de fibras de cromatina mediadas por interferencia entre aisladores para las secuencias del aislador scs y scs' (17). En conjunto, estas observaciones estan de acuerdo con el hecho de que, funcionalmente, los marcadores CC tambien pueden desempenar un papel en la organizaci6n de estructuras de orden superior, que incluyen conformaciones de dominio subcromos6mico que podrian detectarse por el ensayo de captura de conformaci6n cromos6mica (3C) previamente informado (18).
Con el fin de validar las observaciones anteriores, los inventores realizaron analisis sistematicos de marcadores CC en dos genes humanos regulados (Fig. 2). Ambos genes modelo -el gen dihidrofolato reductasa (DHFR) regulado por el ciclo celular (19) y el gen del receptor similar al receptor de calcitonina (CALCRL) especifico del tipo de celula (20-22) -muestran modos alternativos de actividad transcripcional regulada. En el analisis, los inventores estuvieron particularmente interesados en saber si los marcadores CC (i) podrian limitar el intervalo de transcripci6n por ARNPII y (ii) establecer una correlaci6n con cualquier conformaci6n cromos6mica especifica.
El DHFR humano (hDHFR) es un gen relacionado con el ciclo celular controlado a partir de los promotores secundarios en la direcci6n 5' y primarios en la direcci6n 3'. El gen abarca 28,5 kb en el cromosoma 5 y contiene 6 exones (Fig. 2A). Estudios independientes han mostrado que la expresi6n de hDHFR se induce tras la entrada en la fase S del ciclo celular y se desconecta en celulas quiescentes (G0) (Fig. 2A) (23). Mientras que en las fases G1/S la transcripci6n productiva del gen hDHFR es accionada por el promotor principal, en celulas quiescentes, la actividad transcripcional no es derogada, pero cambia a un modo alternativo -a partir del promotor secundario en la direcci6n 5' y que termina activamente en el segundo intr6n. El transcrito del promotor secundario es inestable, pero podria detectarse en abundancia en celulas quiescentes por RT-PCR.
El gen hDHFR contiene tres marcadores CC: (i) en la direcci6n 5' a partir de ambos promotores (CCDHFR-1); (ii) en el segundo intr6n (CCDHFR-2); (iii) en la direcci6n 3' a partir de la senal de poli(A) funcional (CCDHFR-3) (Fig. 3A). Interesantemente, el analisis paralelo revela mas de 40 senales de poli(A) cripticas presentes dentro del mismo gen. Los tres sitios CC descritos mostraron energia libre baja de plegamiento, caracteristica de acidos nucleicos monocatenarios altamente estructurados (Fig. 3A). Para determinar las propiedades de terminaci6n de cada uno de los sitios CC, los inventores cuantificaron por RT-PCR la abundancia de transcritos in vivo, que incluye los inestables y los raros, en la direcci6n 5' y en la direcci6n 3' de los sitios CC. En los tres casos, los inventores encontraron pruebas de terminaci6n de transcritos en los sitios CC (Fig. 3A). En el sitio CCDHFR-1, los inventores detectaron terminaci6n de la transcripci6n de transcritos intergenicos raros. En celulas quiescentes, el transcrito no codificante corto termin6 en el sito CCDHFR-2. Un sitio AATAAA can6nico tambien esta presente pr6ximo al sitio CCDHFR-2 y esa parte de la secuencia de ADN coincide con diversas marcas de secuencias expresadas y ADNc de la base de datos publica. En celulas proliferantes, el sitio CCDHFR-3 marc6 la terminaci6n de la transcripci6n productiva mencionada en cualquier sitio. La asociaci6n del sitio CCDHFR-3 a la senal de poli(A) funcional es similar a la correlaci6n previamente descrita dentro del gen beta-globina.
El segundo gen modelo de elecci6n fue el gen CALCRL humano especifico del tipo de celula (hCALCRL) (Fig. 2B). Codifica un receptor acoplado a la proteina G de los siete dominios transmembrana (GPCR). Los GPCR de mamifero constituyen una familia amplia y diversa de proteinas cuya funci6n principal es transducir los estimulos extracelulares en senales intracelulares. La mayoria de los GPCR responden a senales end6genas (endogGPCR) tales como peptidos, lipidos, neurotransmisores o nucle6tidos. Los endoGPCR estan altamente conservados y sus perfiles de expresi6n son unicos, dando miles de combinaciones de receptores especificos para tejido y celula para la modulaci6n de procesos fisiol6gicos. El repertorio de endoGPCRs consiste en 367 receptores en seres humanos. Sin embargo, los mecanismos que regulan su expresi6n y funci6n especifica siguen siendo ampliamente desconocidos. El endoGPCR codificado por el gen hCALCRL se considera que es una molecula clave en la regulaci6n de la actividad de miembros de la familia de la calcitonina de peptidos que desempenan funciones esenciales en el crecimiento, la supervivencia y la navegaci6n celular. El gen CALCRL humano (103,15 kb) se localiza en el cromosoma 2 y contiene quince exones y se transcribe en diversos tejidos humanos y tumores. El gen hCALCRL se transcribe hasta su longitud completa en celulas endoteliales y no en no endoteliales como se muestra por transferencia Northern e inmunohistoquimica (Fig. 2B). Sin embargo, en celulas no endoteliales podria detectarse un transcrito no codificante que termina en el primer intr6n (Fig. 2B). Los inventores consideraron el gen hCALCRL como un buen modelo de regulaci6n especifica del tipo de celula de expresi6n genica (22).
Similar a hDHFR, los marcadores CC pudieron detectarse tanto en la direcci6n 5' del promotor (CCCALCRL-1) como en la direcci6n 3' de la senal de poli(A) funcional (CCCALCRL-3) del gen hCALCRL. Un tercer marcador CC adicional (CCCALCRL-2) esta presente en el primer intr6n del gen (Fig. 3B). Una RACE en 5' a partir del primer ex6n confirma que todos los transcritos se inician en la direcci6n 3' y ninguno a partir de la direcci6n 5' del marcador CCCALCRL-1. Esto sugiere que CCCALCRL-1 podria terminar transcritos intergenicos que podrian interferir con la unidad de transcripci6n hCALCRL. Un analisis de RACE en 3' confirma la presencia de transcritos terminados pr6ximos a CCCALCRL-2 (en el primer intr6n) y sitios CCCALCRL-3 (en la regi6n en la direcci6n 3' del sitio de escisi6n). Los tres sitios del marcador CC muestran energia libre baja de plegamiento como se muestra anteriormente (Fig. 3B). Por tanto, in vivo, tanto en genes hDHFR y hCALCRL, los marcadores CC muestran propiedades de terminaci6n transcripcionales.
Con el fin de validar la segunda propiedad sugerida del marcador CC, los inventores probaron entonces si participaban en cualquier conformaci6n cromos6mica especifica como se define por el ensayo 3C. Este ensayo se desarroll6 para monitorizar conformaciones cromos6micas altamente flexibles in vivo detectando la proximidad espacial de sitios distantes que participan en la formaci6n de las estructuras similares a bucle. Los inventores han ajustado las condiciones del ensayo para mejorar el rendimiento y la sensibilidad de la detecci6n en celulas humanas (vease Materiales y procedimientos). Y, lo que es mas importante, la etapa inicial del ensayo tambien implica el enriquecimiento de los loci cromos6micos transcritos con inmunoprecipitaci6n anti-ARNPII (24).
Cuando se analizaron para el gen hDHFR, se encontr6 que los sitios de los marcadores CCDHFR-1 y CCDHFR-3, posicionados separados mas de 29 kb, se yuxtaponian en celulas proliferantes normales (Fig. 4A). La proximidad espacial de estos dos sitios fue altamente especifica (Fig. 4A, comparense 1+2, 1+3 en celulas proliferantes) y dependiente en presencia de ARNPII, reticulaci6n, restricci6n, ligaci6n y PCR (Fig. 4A, controles de hDHFR). Como se muestra antes (Fig. 3A), estos dos sitios tambien muestran propiedades de terminaci6n transcripcional en celulas proliferantes.
Los cambios en el modo transcripcional en el gen hDHFR bajo condiciones quiescentes se asocian, entre otras cosas, a generaci6n de transcritos cortos que terminan dentro del segundo intr6n. Y, lo que es mas importante, el gen hDHFR contiene un tercer marcador CC posicionado en el mismo sitio. Analisis previos de la transcripci6n de hDHFR en estado quiescente indicaron que el marcador CCDHFR-2 se activ6 como un sitio de terminaci6n para el transcrito no codificante corto (Fig. 3A). Por tanto, los inventores quisieron analizar si en estado quiescente un modo transcripcional diferente estableceria una correlaci6n con conformaci6n cromos6mica alternativa para el marcador CCDHFR-2. De hecho, como se muestra en la Figura 4A, la conformaci6n in vivo que yuxtapone los marcadores CCDHFR-1 y CCDHFR-2 puede detectarse por el ensayo 3C en celulas quiescentes. S6lo bajos niveles de esta conformaci6n se detectaron en la poblaci6n de celulas proliferantes. Interesantemente, la conformaci6n de CCDHFR1:CCDHFR-2 observada no destruy6 la conformaci6n de CCDHFR-1:CCDHFR-3 descrita anteriormente para las celulas proliferantes. Teniendo en cuenta la naturaleza del ensayo 3C, este resultado podria tener varias explicaciones. En primer lugar, la conformaci6n especifica de quiescentes podria imponerse en exceso en la conformaci6n de CCDHFR1:CCDHFR-3 retenida. En segundo lugar, el resultado podria representar dos poblaciones de celulas ya que cambian de una conformaci6n a la otra. Y, lo que es mas importante, la conformaci6n de CCDHFR-1:CCDHFR-2 fue especifica para el modo quiescente de transcripci6n y de acuerdo con el intervalo de transcritos detectados. Por tanto, los inventores han detectado para el gen hDHFR una conformaci6n cromos6mica in vivo caracterizada por proximidad espacial de marcadores CC. La proximidad de marcadores CCDHFR-1 y CCDHFR-2 fue especifica para el modo transcripcional descrito para el estado quiescente del ciclo celular.
Para probar si los marcadores CC participaban o no en cualquier disposici6n estructural asociada a expresi6n especifica del tipo de celula del gen hCALCRL, los inventores estudiaron sus conformaciones en celulas permisivas (endoteliales, HMVEC) y no permisivas (no endoteliales, HEK293T) para la transcripci6n. En celulas HMVEC, el gen hCALCRL activo muestra un perfil conformacional en el que los tres marcadores CCCALCRL se yuxtapusieron con estrecha proximidad entre CCCALCRL-1:CCCALCRL-2 y CCCALCRL-1:CCCALCRL-3 (Fig. 4B; no se muestran los datos para CCCALCRL-2:CCCALCRL-3). Y, lo que es mas importante, las fronteras de estas dos posibles conformaciones de bucle se correspondieron con las fronteras de los dos transcritos detectados en celulas HMVEC (Fig. 2B). Para probar si cualquiera de estas conformaciones era unica para celulas HMVEC, los inventores analizaron hCALCRL en celulas HEK293T transcripcionalmente no permisivas. Aunque los inventores todavia detectaban la yuxtaposici6n de CCCALCRL-1 y CCCALCRL-2, la interacci6n entre CCCALCRL-1 y CCCALCRL-3, que engloba la longitud completa del gen hCALCRL, ya no estaba presente (Fig. 4B). La conformaci6n de CCCALCRL-1:CCCALCRL-2 coincide con la presencia de transcritos de hCALCRL cortos que terminan en el primer intr6n en el sitio CCCALCRL-2 en celulas HEK293T (Fig. 2B). Por tanto, la expresi6n especifica del tipo de celulas del gen hCALCRL esta asociada a una conformaci6n cromos6mica unica, como se detecta entre marcadores CCCALCRL-1 y CCCALCRL-3. Y, lo que es mas importante, esta conformaci6n engloba la longitud completa de los transcritos productivos generados en celulas HMVEC.
La aplicaci6n del analisis de reconocimiento de patrones a las fronteras de 422 genes humanos anotados ha identificado y definido varios marcadores, que incluyen un marcador previamente desconocido implicado en la regulaci6n transcripcional. El marcador -Checkpoint Charlie -establece coherentemente una correlaci6n con las fronteras de unidades transcripcionales codificantes y no codificantes en diversos espectros de especies (vease tambien la Fig. 5), muestra estructuras secundarias y terciarias altamente ordenadas para los transcritos correspondientes, se asocia a la terminaci6n de la transcripci6n regulada por ARNPII in vivo y dirige la formaci6n de conformaciones cromos6micas alternativas dependientes de la transcripci6n. Sorprendentemente, cuando se analiza en los genes hDHFR especificos del ciclo celular y hCALCRL especificos del tipo de celula, el marcador se asocia funcionalmente a las distintas conformaciones estructurales de alto orden que son caracteristicas de uno o de los otros modos de la actividad transcripcional. Los marcadores CC yuxtapuestos no s6lo establecen una correlaci6n con estructuras de sub-cromatina cargadas con ARNPII, sino que tambien perfilan las fronteras de los transcritos sintetizados dentro de aquellas estructuras. Los datos de los inventores estan de acuerdo con sugerencias previas de que las estructuras de alto orden se forman en un modo dependiente de la transcripci6n y podrian ser importantes para la reiniciaci6n transcripcional.
La regulaci6n transcripcional se realiza a diversos niveles importantes por una multitud de actividades ligadas a reclutamiento especifico de secuencias de ADN, modificaci6n de cromatina y remodelaci6n de marcadores CC y organizaci6n estructural asociada que estan claramente implicadas in vivo en el establecimiento de las fronteras externas para diversas unidades transcripcionales.
Transferencia Northern
Se realiz6 transferencia Northern para hDHFR a partir de ARN total aislado de celulas U20S. Las celulas proliferantes se cultivaron en presencia de 10% de SBF mientras que la celula quiescente se logr6 bajo inhibici6n por contacto en presencia de 0,5% de SBF. Como sonda se usaron sondas sintetizadas usando un molde que engloba secuencias entre el cuarto y el sexto ex6n de hDHFR.
La transferencia Northern para hCALCRL se realiz6 como se ha descrito previamente (25). La CL humana de longitud completa se amplific6 por RT-PCR y se clon6 en el vector pcDNA3.1. El vector resultante se secuenci6 usando un analizador Applied Biosystems 377 Genetic y la secuencia se cotej6 con la base de datos GenBank. El inserto se escindi6 y se us6 como molde para generar sondas.
En cualquier caso, las sondas se marcaron con 32P-dCTP usando el kit de marcado MegaPrime (Amersham, RU). Despues de la hibridaci6n y lavados rigurosos, la transferencia se expuso a Hyperfilm (Amersham, RU) y luego a la pantalla de f6sforo. Las senales de hibridaci6n se analizaron usando el software ImageQuant.
Citometria de flujo activada por fluorescencia (FACS)
La citometria FACS de celulas en crecimiento U20S y quiescentes se realiz6 como se ha descrito previamente (26).
Reaccion en cadena de la polimerasa por transcripcion inversa (RT-PCR)
La PCR por transcripci6n inversa para determinar la terminaci6n de transcritos en hDHFR se realiz6 en ARN total aislado de celulas U20S. Se usaron los siguientes cebadores directos e inversos para los sitios CCDHFR-1, CCDHFR-2 y CCDHFR-3:
CCDHFR-1
Cebador directo (A): tggggaactgcacaatatga (SEC ID NO: 1)
Cebador inverso (B): aggggtgcgtcttttaacct (SEC ID NO: 2)
Cebador inverso (C): ccgcacgtagtaggttctgtc (SEC ID NO:3)
CCDHFR-2
Cebador directo (A): ttccagagaatgaccacaacc (SEC ID NO: 4)
Cebador inverso (B): tgttccttttgatcgtggtg (SEC ID NO: 5)
Cebador inverso (C): tggggtatctaatcccagtttg (SEC ID NO: 6) CCDHFR-3
Cebador directo (A): tttggaaaaacccatgaagg (SEC ID NO: 7)
Cebador inverso (B): caacagtcctgccagttgtt (SEC ID NO: 8)
Cebador inverso (C): cagggttttggtctgtcacc (SEC ID NO: 9)
La RT-PCR se realiz6 usando el kit de transcripci6n inversa 0mniscript de Qiagen, RU.
Amplificacion rapida de extremos de ADNc (RACE)
La RACE se realiz6 esencialmente como se ha descrito previamente (27). Los cebadores especificos de gen se disenaron para RACE en 3' (cagagagtgtcacctcctgctttagg) (SEC ID NO: 10) y 5' (cccacaagcaaggtgggaaagagtg) (SEC ID NO: 11) basandose en la secuencia de ADNc de CALCRL humano (28). Los transcritos de RACE en 5' y 3' (que terminan en el primer intr6n) se secuenciaron y se enviaron a la base de datos GenBank.
Produccion y caracterizacion de anticuerpos
El anticuerpo policlonal de conejo LN-1436 se produjo contra el peptido sintetico correspondiente a los residuos 427461 (HDIENVLLKPENLYN) (SEC ID NO: 12) en el extremo C de la proteina CL humana (hCL) (numeros de acceso AAC41994 y AAA62158; codificado por el gen CALCRL). La especificidad de los anticuerpos se caracteriz6 por analisis de inmunotransferencia de CL transitoriamente expresada en celulas HEK293T.
Inmunocitoquimica
Especimenes incorporados en parafina fijados con formalina (n=74) de 20 tejidos humanos normales se seleccionaron de los documentos de archivo del Departamento de patologia celular, Hospital John Radcliffe; Universidad de 0xford, 0xford, RU. Se produjeron multiples micromatrices de tejido (TMA) adquiriendo nucleos cilindricos (1,0 mm de diametro) para cada especimen dispuesto a alta densidad en un bloque de TMA del receptor (29). El procedimiento de recuperaci6n del antigeno se llev6 a cabo en secciones sin cera y rehidratadas de 4 Im antes de realizar la inmunohistoquimica usando el anticuerpo anti-hCL LN-1436. La inmunohistoquimica se realiz6 esencialmente como se ha descrito previamente (30). Se usaron anticuerpos secundarios biotinilados, el kit Vectastain ABC-AP del complejo de estreptavidina-fosfatasa alcalina y el sistema de detecci6n Vector Red (todos de Vector, Burlingame, US). Los controles incluyeron suero de conejo preinmune usado a concentraciones apropiadas.
Captura de conformacion cromosomica (3C)
El analisis 3C se realiz6 como se ha descrito previamente (31) con las siguientes modificaciones. Se reticularon aproximadamente 4 x 106 celulas completas tratando con 2% de formaldehido a temperatura ambiente durante 10 min. La reticulaci6n se detuvo con cantidad equimolar de glicina y las celulas se recogieron y se lisaron en tamp6n hipot6nico (Tris-HCl 10 mM [pH 7,2], MgCl2 2 mM y 0,5% de Triton X-100). Entonces, los nucleos se resuspendieron y se incubaron durante 20 min sobre hielo en tamp6n CSK (NaCl 100 mM, sacarosa 300 mM, PIPES 10 mM [pH 6,8], MgCl2 3 mM, leupeptina 10 IM, EGTA 1 mM, PMSF 1,2 mM y 0,5% de Triton X-100). La suspensi6n se centrifug6 durante 5000 rpm a 4OC en una centrifuga Hettich Mikro 22R y el sedimento se trat6 con NaCl 2 M. Despues de incubarse durante 10 min sobre hielo se anadi6 una cantidad suficiente de agua para reducir la concentraci6n de NaCl a 150 mM. Esta muestra se us6 para realizar el ensayo de inmunoprecipitaci6n de cromatina con ARNPII como se ha descrito previamente (32). La cromatina inmunoprecipitada con el anticuerpo ARNPII (H224, Santa Cruz Biotechnology Inc., EE.UU.) se restringi6 luego con la enzima de restricci6n 8gl11 (New England Biolabs, RU) y se lig6 a ADN ligasa T4 (Roche, RU). Despues de digerirse las proteinas con proteinasa K (Roche, RU) y el ARN con ribonucleasa A (Sigma, RU), el ADN se extrajo con etanol. El analisis por PCR en el ADN extraido se hizo usando cebadores especificos de genes con TakaRa LA Taq' de Takara Bio Inc., Jap6n.
Diagnostico de cancer de ovario y de prostata
Expresion de MLH1 en tejidos normales y con cancer de ovario (vease la Fig. 8)
Los genes supresores de tumores desempenan una funci6n vital en la supervivencia y el mantenimiento de celulas. El silenciamiento de supresores tumorales senaliza el crecimiento incontrolado que conduce a cancer. Como mecanismo de seguridad, las celulas experimentan apoptosis cuando se detectan tales senales para crecimiento incontrolado.
Un hom6logo humano del gen mutL de Escherichia coli, cancer de colon sin poliposis, tipo 2 (MLH1), es un gen tal que codifica un gen de reparaci6n del mal apareamiento de ADN. MLH1 senaliza el mecanismo de reparaci6n iniciado por la lesi6n del ADN e induce apoptosis de celulas tumorales. Este gen se localiz6 en los loci 3p21.3 y acumula diversas mutaciones y modificaciones a medida que envejecen las celulas. Un cambio tal -aumento de los niveles de metilaci6n en la regi6n promotora de MLH1 -se ha asociado a cancer hereditario de colon sin poliposis. Por tanto, se ha mostrado que las variantes de corte y empalme de MLH1 alternativas son especificas de tejido y contribuyen a la variabilidad fenotipica en canceres heredados.
Para ver si las variaciones de corte y empalme inducidas por la mutaci6n de MLH1 estan asociadas a cancer de ovario, los inventores buscaron sitios CC que englobaban la unidad de transcripci6n. Escaneando la secuencia de MLH1, los inventores encontraron un marcador CC en el 8O intr6n y otro en las fronteras formadas en la UTR de 3' de una variante de corte y empalme alternativa. El analisis 3C realizado en estos dos sitios muestra que los sitios CC s6lo se yuxtaponen en pacientes normales. Mientras tanto, las muestras de tejido y fluido recogidas de pacientes con cancer de ovario no revelan yuxtaposici6n. Por tanto, los sitios CC de MLH1 pueden usarse como marcador para distinguir cancer de ovario.
Cancer de prostata
Las pruebas para marcadores de diagn6stico de pr6stata se realizaron en lineas celulares que representaban tanto estado benigno como tardio de crecimiento tumoral. Los genes de elecci6n fueron PSA y B0RIS.
Expresion de BORIS y PSA en tejidos normales y de cancer de prostata (vease la Fig. 9)
Un novedoso miembro de la familia de los genes de cancer-testiculos, el hermano del regulador de los sitios impresos (B0RIS), se expresa s6lo en espermatocitos y no en celulas somaticas normales. Sin embargo, su expresi6n se ha asociado a varios canceres humanos que incluyen cancer de mama y de pulm6n. B0RIS compite con otro factor de transcripci6n del dedo de Zn, CTCF, por las perturbaciones epigeneticas en tumores malignos humanos. De ahi que los inventores decidieran probar la asociaci6n de B0RIS con carcinoma de pr6stata humano (LNCaP).
B0RIS tiene dos sitios CC que engloban la unidad de transcripci6n definida en la localizaci6n cromos6mica 20q13.31. Como el gen se expresa significativamente en tumores malignos, los inventores decidieron probar la yuxtaposici6n de dos sitios CC en LNCaP. De los resultados mostrados en la figura adjunta, la yuxtaposici6n de sitios CC s6lo se produce en LNCaP y no en lineas celulares de osteosarcoma humano (U20S). Se estableci6 otra confirmaci6n por secuenciaci6n del producto de PCR.
Los inventores tambien miraron en otro marcador de cancer de pr6stata bien establecido, el antigeno especifico de pr6stata (PSA). El PSA codificado por el gen calicreina humana 3 (KLK3) se usa para el diagn6stico y el pron6stico de cancer de pr6stata detectando los niveles de proteina PSA en sangre. Sin embargo, los inventores usaron aqui la tecnica 3C para mirar el gen PSA en celulas de osteosarcoma humano y lineas celulares de hiperplasia benigna de pr6stata (BPH1). Como se observa en B0RIS, la unidad de transcripci6n KLK3 se define por dos sitios CC, uno en la UTR de 5' y el otro en la UTR de 3'. Los resultados muestran que estos dos sitios CC s6lo interfieren en celulas BPH1 y no en U20S.
Por tanto, PSA y B0RIS pueden usarse como biomarcadores para identificar celulas de cancer de pr6stata benigno y maligno, respectivamente.
Procedimientos de PCR
MLH1
Enzima de restricci6n de 3C -8ssS1
Cebadores de MLH1
MF3UTR2 TGGTTTTAGCTGGGATGGAG MF3UTR1 GAGGCAGGCAGATCACTTGT
MREI2 AGAAGATGCAGGCCAACAAT MREI1 CTCGTAAAGCCCAAGGAGGT
Primera ronda de reaccion de PCR
2x tamp6n I
25 Il
dNTP (2,5 mM)
8 Il
ADN
1 Il
Cebadores (25 fM)
Directo (MREI2)
1 Il
Inverso (MF3UTR2)
1 Il
TakaRa LA Taq
0,5 Il
Agua 13,5 Il
Total 50 1l Cebadores
MREI2 - MF3UTR2
Programa de PCR
94OC -5min 94OC -1 min 57OC -1min durante 30 ciclos 72OC -45 s
72OC -5min
Tamanos de producto esperados
5 MREI2 -MF3UTR2 -527 pb
Segunda ronda de reaccion por PCR
2x tamp6n I 25 Il dNTP (2,5 mM) 8 Il ADN 2 Il Cebadores (25 fM) Directo (MREI1) 1 Il Inverso (MF3UTR1) 1 Il TakaRa LA Taq 0,5 Il Agua 12,5 Il
Total 50 1l Cebadores
MREI1-MF3UTR1
Muestras
10 Tomar 48 Il de mezcla y 2 Il de reacci6n de PCR respectiva de la 1a ronda
Programa de PCR
94OC -5min 94OC -1min 59OC -1min durante 25 ciclos 72OC -30 s
72OC -5min
Tamanos de producto esperados
MREI1 -MF3UTR1 -325 pb
BORIS
15 Enzima de restricci6n de 3C -Taq1
Cebadores de BORIS
BR5UTR4 GGCTGGAATTGCCCTAAAGT BR5UTR3 CCTATGAGGGGGCAGTATCA
BR3UTR2 GCTCTTCCTGCTGGGAAAT BR3UTR1 TACAGGGGTGGAGACAGGTT
Primera ronda de reaccion de PCR
2x tamp6n I 25 Il dNTP (2,5 mM) 8 Il ADN 1 Il Cebadores (25 fM) Directo (BR5UTR4) 1 Il Inverso (BR3UTR2) 1 Il TakaRa LA Taq 0,5 Il Agua 13,5 Il
Total 50 1l Cebadores
BR5UTR4 -BR3UTR2
Programa de PCR
94OC -5min
94OC -45 s
57OC -30s durante 30 ciclos
72OC -25 s 72OC -5min Tamanos de producto esperados BR5UTR4 -BR3UTR2 -430 6 784 pb Nota: Se facilitan dos tamanos de producto porque la enzima de restricci6n de 3C (Taq I) se escinde en cualquiera de los dos sitios de restricci6n pr6ximos al marcador CC.
Segunda ronda de reaccion de PCR
2x tamp6n I 25 Il dNTP (2,5 mM) 8 Il ADN 2 Il Cebadores (25 fM) Directo (BR5UTR3) Il Inverso (BR3UTR1) 1 Il TakaRa LA Taq 0,5 Il Agua 12,5 Il
Total 50 1l Cebadores
BR5UTR3 -BR3UTR1
Muestras
Tomar 48 Il de mezcla y 2 Il de reacci6n de PCR respectiva de la 1a ronda
Programa de PCR
94OC -5min
94OC -45 s
55OC -30s durante 25 ciclos
72OC -20 s 72OC -5min Tamanos de producto esperados BR5UTR3 -BR3UTR1 -260 6 564 pb Nota: Aqui se facilitan dos tamanos de producto porque la enzima de restricci6n de 3C (Taq I) se escinde en cualquiera de los dos sitios de restricci6n pr6ximos al marcador CC. La Figura 9 muestra la banda de 564 pb, que se ha verificado por secuenciaci6n.
PSA
Enzima de restricci6n de 3C -Taq1
Cebadores de PSA
PR5UTR2 CGTGATCCACCCATCTCAG PR5UTR1 CTATTGGGAGACCGAAGCAG
PF3UTR2 GGGAAAGGGAGAAGATGAGG PF3UTR1 TAGGGGAAGGTTGAGGAAGG
Primera ronda de reaccion de PCR
2x tamp6n I 25 Il dNTP (2,5 mM) 8 Il ADN 1 Il Cebadores (25 fM) Directo (PR5UTR2) 1 Il Inverso (PF3UTR2) 1 Il TakaRa LA Taq 0,5 Il Agua 13,5 Il
Total 50 1l Cebadores
PR5UTR2-PF3UTR2
Programa de PCR
94OC -5min
94OC -45 s
61OC -30s durante 30 ciclos
72OC -25 s 72OC -5min
Tamanos de producto esperados
PR5UTR2 -PF3UTR2 -481 pb
Segunda ronda de reaccion de PCR
2x tamp6n I
25 Il
dNTP (2,5 mM)
8 Il
ADN
2 Il
Cebadores (25 fM)
Directo (PR5UTR1)
1 Il
Inverso (PF3UTR1)
1 Il
TakaRa LA Taq
0,5 Il
Agua
12,5 Il
Total
50 1l
Cebadores
PR5UTR1 -PF3UTR1
Muestras
Tomar 48 Il de mezcla y 2 Il de reacci6n de PCR respectiva de la 1a ronda
Programa de PCR
94OC -5min
94OC -45 s
61OC -30s durante 25 ciclos
72OC -20 s 72OC -5min Tamanos de producto esperados PR5UTR1 -PF3UTR1 -266 pb Detalles de marcadores CC MLH1 CC1 -24367 pb en la direcci6n 3' de TSS TAACCCCAT CC2-57357 pb en la direcci6n 3' de TSS TAACATAA (Las letras subrayadas en negrita representan la secuencia del marcador CC) En tejido normal, el gen se expresa con transcritos alternativos. Un transcrito tal empieza en el 8O intr6n en el que esta presente CC1 y termina en el marcador CC2. En tejido de cancer de ovario, el gen esta regulado por disminuci6n ya que acumula mutaciones, deleciones y metilaci6n que conducen a transcritos defectuosos o a no transcritos. Los inventores encontraron la yuxtaposici6n de CC1 y 2 en tejidos normales, y no en tejidos de cancer de ovario. Esto se refiere al cambio en el modo transcripcional del gen en estos tejidos.
BORIS
CC1 -5282 pb en la direcci6n 5' de TSS
CTTTGAAAGC
CC2 -28038 pb en la direcci6n 3' de TSS
AAAATTGCT
(Las letras subrayadas en negrita representan la secuencia del marcador CC)
B0RIS tiene dos sitios CC, uno en la UTR de 5' y el otro en la UTR de 3'. En celulas U20S no se espera la expresi6n de B0RIS y de ahi que no deba observarse yuxtaposici6n de marcadores CC. Mientras que, en la linea celular de carcinoma de pr6stata humano (LNCaP), B0RIS se expresa. Los inventores encontraron una yuxtaposici6n de CC1 y CC2 en LNCaP y no en U20S.
PSAlKLK3
CC1 -408 pb en la direcci6n 5' de TSS CTGGTCTCAGAGT CC2 -5843 pb en la direcci6n 3' de TSS
TACTGTGGTTTA
(Las letras subrayadas en negrita representan la secuencia del marcador CC)
KLK3 tiene dos sitios CC, uno en la UTR de 5' y el otro en la UTR de 3'. En celulas U20S no se espera la expresi6n de KLK3 y de ahi que no deba observarse yuxtaposici6n de marcadores CC. Mientras que, en la linea celular de hiperplasia prostatica benigna (BPH-1), KLK3 se expresa. De ahi que la yuxtaposici6n de CC1 y CC2 se observe en pbH-1 y no en U20S.
Referencias
1.
P. R. Cook, I. A. Brazell, E. Jost, Journal of Cell Science 22, 303 (noviembre, 1976).
2.
T. Cremer, C. Cremer, Nat Rev Genet 2, 292 (Apr, 2001).
3.
D. Carter, L. Chakalova, C. S. 0sborne, Y. F. Dai, P. Fraser, Nature Genetics 32, 623 (diciembre, 2002).
4.
J. E. Collins y col., Genome Research 13, 27 (enero, 2003).
5.
T. A. Down, T. J. Hubbard, Genome Research 12, 458 (marzo, 2002).
6.
M. E. Tipping, Journal of Machine Learning Research 1, 211 (1 de junio de 2001).
7.
M. J. Dye, N. J. Proudfoot, Cell 105, 669 (1 de junio de 2001).
8.
N. J. Proudfoot, A. Furger, M. J. Dye, Cell 108, 501 (22 de febrero de 2002).
9.
G. Yeung y col., Molecular and Cellular Biology 18, 276 (enero, 1998).
10.
M. Yonaha, N. J. Proudfoot, EMB0 Journal 19, 3770 (17 de Julio de 2000).
11.
M. Zuker, Nucleic Acids Research 31, 3406 (1 de Julio de 2003).
12.
A. Teixeira y col., Nature 432, 526 (25 de noviembre de 2004).
13.
S. West, N. Gromak, N. J. Proudfoot, Nature 432, 522 (25 de noviembre de 2004).
14.
M. Kim y col., Nature 432, 517 (25 de noviembre de 2004).
15.
T.I. Gerasimova, V. G. Corces, Cell 92, 511 (20 de febrero de 1998).
16.
K. Byrd, V. G. Corces, Journal of Cell Biology 162, 565 (18 de agosto de 2003).
17.
J. Blanton, M. Gaszner, P. Schedl, Genes and Development 17, 664 (1 de marzo de 2003).
18.
J. Dekker, K. Rippe, M. Dekker, N. Kleckner, Science 295, 1306 (15 de febrero de 2002).
19.
J. E. Slansky, P. J. Farnham, Bioessays 18, 55 (enero, 1996).
20.
B. Fluhmann, M. Lauber, W. Lichtensteiger, J. A. Fischer, W. Born, Brain Research 774, 184 (7
de noviembre de 1997).
21.
N. Aiyar y col., Journal of Biological Chemistry 271, 11325 (10 de mayo de 1996).
22.
L. L. Nikitenko, D. M. Smith, R. Bicknell, M. C. Rees, FASEB Journal 17, 1499 (agosto, 2003).
23.
S. L. Hendrickson, J. S. Wu, L. F. Johnson, Proceedings of the National Academy of Sciences of the United States of America 77, 5140 (septiembre, 1980).
24.
R. Metivier y col., Cell 115, 751 (12 de diciembre de 2003).
25.
L. L. Nikitenko y col., Molecular Human Reproduction 7, 655 (julio, 2001).
26.
Z. Darzynkiewicz, The Cell Cycle. A Practical Approach. P. Fantes, R. Brooks, Eds. (IRL Press, 0xford, 1993), pag. 45-68.
27.
L. L. Nikitenko, D. M. Smith, R. Bicknell, M. C. Rees, FASEB Journal 17, 1499 (agosto, 2003).
28.
N. Aiyar y col., Journal of Biological Chemistry 271, 11325 (10 de mayo de 1996).
29.
J. Kononen y col., Nature Medicine 4, 844 (Jul, 1998).
30.
L. L. Nikitenko, I. Z. MacKenzie, M. C. Rees, R. Bicknell, Molecular Human Reproduction 6, 811 (septiembre, 2000).
31.
J. Dekker, K. Rippe, M. Dekker, N. Kleckner, Science 295, 1306 (15 de febrero de 2002).
32.
R. Metivier y col., Cell 115, 751 (12 de diciembre de 2003). Una descripcion de marcadores CC y su deteccion
El analisis de reconocimiento de patrones se ha aplicado ampliamente a diversos campos de estudio tales como medicina, ingenieria y lingOistica en los que el analisis de imagenes y la descodificaci6n de datos permiten la identificaci6n de marcadores caracteristicos subyacentes dentro de sistemas complejos. Los inventores han usado metodologia de reconocimiento de patrones para analizar datos del genoma humano en relaci6n con las unidades transcripcionales, procesadas por ARN polimerasa II. Se us6 un conjunto de secuencias de 422 genes manualmente anotados en el cromosoma humano 22 para la identificaci6n computacional de senales reguladoras presentes en las fronteras de las unidades transcripcionales. Se dio atenci6n particular a la identificaci6n de las senales en el extremo 3' de las unidades de transcripci6n. Esto demostr6 ser funcionalmente relevante ya que experimentos posteriores confirmaron que las senales tenian propiedades de terminaci6n in vivo.
El patr6n encontrado en las fronteras tiene senales multiplex y se representa en un formato XML que explica 3 aspectos clave.
a.
Los alfabetos del ADN de cada senal identificada
b.
La variaci6n posicional de cada senal como anchura de distribuci6n gaussiana
c.
Distancia entre cada senal en un patr6n en par de bases
Como los patrones se observan en las fronteras de unidades transcripcionales, los inventores lo llamaron marcador 'Checkpoint Charlie' (CC).
Los marcadores CC en una secuencia desconocida pueden identificarse usando un conjunto de c6digo identificado como 'escaner'. El escaner necesita 3 datos de entrada del usuario
a.
La secuencia en estudio
b.
El patr6n en formato XML
c.
Un factor de rigurosidad (puntuaci6n logaritmica inversa) para descartar marcadores CC debiles (valor por defecto: 0,99, por ejemplo)
El escaner lee el ADN de entrada e intenta ajustar los patrones en la secuencia. Esto se hace pasando por la secuencia de ADN tomando cada base como punto de referencia. El escaner empieza con la primera base como punto de referencia e intenta ajustar el patr6n definido en el formato XML. El grado de aptitud se determina por una puntuaci6n. Si esta puntuaci6n es mayor que el factor de rigurosidad suministrado por el usuario, se encontr6 un marcador CC. La posici6n del marcador CC identificada se facilita en un formato de GFF patr6n y el escaner se mueve a la segunda base en la secuencia de entrada.
Este procedimiento se repite hasta que el escaner lee todas las bases en el ADN de entrada y su cadena complementaria.
Los resultados finales de este escaneado para el patr6n del marcador CC seran un archivo de texto con posibles posiciones del marcador CC en la secuencia de entrada con su puntuaci6n respectiva en el formato GFF.
Deteccion del marcador CC
Para ilustrar la detecci6n del marcador CC en una secuencia dada se considera la siguiente secuencia.
Dada esta secuencia, se hace un escaneado de izquierda a derecha para encontrar el marcador CC. Ahora se considera la 50a base (subrayada) como punto de referencia de los inventores. Para determinar si esta base es un marcador CC o no, los 4 conjuntos de pesos descritos en la Tabla 1 deberian coincidir con esta secuencia. Por sencillez se muestra un ejemplo en el que los 4 conjuntos de pesos (tambien subrayados) estan presentes.
Como se ha descrito antes, los 4 conjuntos de pesos tienen una distancia relativa entre si con respecto al punto de referencia. Por ejemplo, de la Tabla 1 puede observarse que el primer conjunto de peso empieza en la posici6n 8 con respecto al punto de referencia. Este primer conjunto de peso tiene 19 valores posicionales para cada tipo de aparici6n de nucle6tidos en esa posici6n. Por ejemplo, para la primera posici6n, una guanina conseguira un valor de 0,19 y una timina puntuara 0,33. Asimismo, para la segunda posici6n, una guanina puntuara 0,20 y una timina puntuara 0,39. La segunda posici6n se multiplica por la primera puntuaci6n. Esto se repite hasta que los 19 valores posicionales sean leidos y multiplicados por su valor previo.
En el ejemplo de los inventores, los inventores tienen TTTTTTTTTTTTTTTTGGT que empieza en una 8a base en relaci6n con el punto de referencia. De ahi que la puntuaci6n de los inventores para este conjunto de peso sea (0,33*0,39*0,34*0,35*0,41...), etc.
Este procedimiento tambien se repite para los otros 3 conjuntos de pesos, multiplicando cada vez el valor posicional por la puntuaci6n previa calculada hasta ese momento.
La puntuaci6n final de los 4 conjuntos de pesos se convierte en una puntuaci6n (logaritmica inversa) de valor exponencial para su facil manipulaci6n. La puntuaci6n logaritmica es igual a 1,0/(1+e-x) en la que X es la puntuaci6n obtenida por el procedimiento anterior usando los pesos en la Tabla 1. Si esta puntuaci6n logaritmica es superior a 0,90 (por ejemplo), entonces esa base se considera marcador CC. En el ejemplo de los inventores, la multiplicaci6n de los valores posicionales de los 4 conjuntos de pesos dio una puntuaci6n logaritmica inversa de 0,99999. Como este valor es superior a 0,99, la 50a base, A, esta dentro de la secuencia del marcador CC. El analizar otras bases en la secuencia permite la identificaci6n de la secuencia desde la base 41a hasta la base 56a como marcador CC (con una puntuaci6n final de 0,99968).
Procedimiento usado en detectar la yuxtaposicion de marcadores CC in vivo
El procedimiento descrito mas adelante identifica ampliamente las etapas clave en la detecci6n de la yuxtaposici6n de marcadores CC en muestras de tejido. Esta es la primera metodologia desarrollada para analizar muestras congeladas de tejido de pacientes.
Las muestras de tejido se rebanan en secciones delgadas sobre un portaobjetos de vidrio
Anadir 1 ml de 1x PBS frio en hielo al portaobjetos y lavar durante 5 min
Anadir paraformaldehido 0,67 M para reticular proteina y ADN
Incubar durante 10 min a temperatura ambiente en una plataforma de balanceo
Anadir glicina 1 M para extinguir la reacci6n de reticulaci6n
Raspar las celulas y transferir las celulas a una Eppendorf
Centrifugar a 13.000 rpm durante 1 min para recoger las celulas a temperatura ambiente
Eliminar el sobrenadante y anadir 1 ml de tamp6n hipot6nico helado
Pipetear las celulas una cuantas veces para preparar una fina suspensi6n de celulas (si se requiere, centrifugar un poco rapidamente)
Incubar sobre hielo durante 10 min para hinchar la celula y que los nucleos emerjan
Centrifugar a 5.000 rpm durante 5 min a 4OC para recoger los nucleos
Drenar el sobrenadante de citosol y disolver el sedimento de nucleos en 1 ml de tamp6n CSK
Incubar sobre hielo durante 20 min
Centrifugar a 5.000 rpm durante 5 min a 4OC para recoger los nucleos
Drenar el sobrenadante en la medida de lo posible y retener el sedimento
Disolver el sedimento de celulas en NaCl 2 M (la disoluci6n se vuelve viscosa)
Incubar sobre hielo durante 10 min
Diluir la muestra con agua suficiente para reducir la concentraci6n de NaCl a 150 mM
Anadir 10 Il de anticuerpo Pol II (H-224) a la Eppendorf
Incubar a 4OC durante la noche con agitaci6n o rotaci6n
Tomar 30 Il de la suspensi6n de perlas de proteina G-Sepharose para conseguir aproximadamente 20 Il de perlas secas (cortar la punta de la pipeta si se requiere)
Centrifugar a 2.000 rpm durante 3 min para recoger las perlas
Lavar dos veces con 1 ml de agua MilliQ y centrifugar a 2.000 rpm durante 3 min para recoger las perlas
Anadir 1 ml de tamp6n de lavado de restricci6n a las perlas
Mezclar bien y dispensar a diferentes Eppendorfs (si se requiere), lavar y centrifugar a 2.000 rpm durante 3 min para recoger las perlas
Transferir el contenido completo a la Eppendorf con perlas y mezclar bien
Incubar a 4OC durante 1 hora con agitaci6n o rotaci6n
Centrifugar a 1000 rpm durante 3 min a 4OC y eliminar el sobrenadante. El sobrenadante puede analizarse para fracciones sin unir.
Anadir 1 ml de tamp6n de lavado de restricci6n, rotar a 4OC durante 5 min, centrifugar a 2000 rpm durante 3 min a 4OC. Eliminar el sobrenadante.
Anadir 1 ml de tamp6n de lavado de restricci6n, rotar a 4OC durante 5 min, centrifugar a 2000 rpm durante 3 min a 4OC. Eliminar el sobrenadante.
Anadir 1 ml de tamp6n de lavado de restricci6n, rotar a 4OC durante 5 min, centrifugar a 2000 rpm durante 3 min a 4OC. Eliminar el sobrenadante.
Medir las perlas y la cantidad de tamp6n de restricci6n que queda, anadir
Tamp6n de restricci6n 1x
Enzima de restricci6n 30-60 unidades
Agua Variable para 100 Il de reacci6n
Digerir el ADN incubando a 37OC durante la noche
Incubar a 65OC durante 10 min para detener la digesti6n por restricci6n
Anadir > 200 Ig/ml de RNasa A al tamp6n
Incubar a 37OC durante 30 min
Anadir 400 Il de agua MilliQ y diluir la reacci6n de restricci6n
Anadir
Tamp6n de ligaci6n 1x
ADN ligasa T4 30 unidades
Agua Variable para 100 Il de reacci6n
Incubar a 16OC durante 4 h
Incubar a 65OC durante la noche para reticulaciones inversas
Anadir 450 Ig de proteinasa K a cada muestra
Incubar a 42OC durante 1 hora para digerir las proteinas
Anadir 660 Il de fenol, pH 7,9 (volumen igual) a cada muestra y remover con v6rtex
Centrifugar a 13.000 rpm durante 10 min
Transferir el sobrenadante a la Eppendorf de 1,5 ml
Anadir 0,3 M de NaCl y 0,5 Ig de gluc6geno
Mezclar bien y anadir 1 ml de etanol helado
Precipitar el ADN a -80OC durante 1 hora
Centrifugar a 14.000 rpm durante 20 min a 4OC
Resuspender el sedimento de ADN en 10 Il de agua libre de RNasa
Establecer una reacci6n de PCR TakaRa para cada muestra
Tamp6n de PCR 1x
dNTP 200 IM de cada NTP
ADN 1 Il
Cebador directo 0,5 IM
Cebador inverso 0,5 IM
TakaRa LA Taq 2,5 unidades
Agua Variable para 50 Il de reacci6n
Ejecutar las muestras en un gel de agarosa al 2%
Tabla 1
<?xml version=&quot;1.0&quot; ?>
-
<modelo> <peso por unidad=&quot;-0,10936629789322752&quot; /> <peso por unidad=&quot;-9,14545921645492&quot; /> -<limitaci6n de peso=&quot;9,722125061947459&quot; no logaritmico=&quot;falso&quot;>
-
<posici6n posicionada=&quot;8&quot; max=&quot;verdadero&quot;> <ancho de la distribuci6n gaussiana=&quot;0,7303045966167145&quot; compensaci6n=&quot;0&quot; />
-<inversa de la matriz de pesos=&quot;0,0" normalizado por maximo=&quot;falso&quot; alfabeto=&quot;ADN" columnas=&quot;19&quot;> -<pos de las columnas=&quot;0&quot;> <simbolo de peso=&quot;guanina"
peso=&quot;0,19891304347826086&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,32065217391304346&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,14673913043478262&quot; /> <simbolo de peso=&quot;timina&quot; peso=&quot;0,33369565217391306&quot; /> </columna> -<pos de las columnas=&quot;1&quot;> <simbolo de peso=&quot;guanina&quot; peso=&quot;0,2076086956521739&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,23804347826086958&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,1641304347826087&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,39021739130434785&quot; /> </columna> -<pos de las columnas=&quot;2&quot;> <simbolo de peso=&quot;guanina&quot;
peso=&quot;0,22934782608695653&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,2423913043478261&quot; />
<simbolo de peso=&quot;adenina&quot; peso=&quot;0,1858695652173913&quot; /> <simbolo de peso=&quot;timina&quot; peso=&quot;0,3423913043478261&quot; /> </columna>
-
<pos de las columnas=&quot;3&quot;> <simbolo de peso=&quot;guanina&quot; peso=&quot;0,23369565217391305&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,29456521739130437&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,12065217391304348&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,35108695652173916&quot; /> </columna> -<pos de las columnas=&quot;4&quot;> <simbolo de peso=&quot;guanina&quot;
peso=&quot;0,22065217391304348&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,22065217391304348&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,14673913043478262&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,41195652173913044&quot; /> </columna> -<pos de las columnas=&quot;5&quot;> <simbolo de peso=&quot;guanina&quot;
peso=&quot;0,2554347826086957&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,22934782608695653&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,16847826086956522&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,3467391304347826&quot; /> </columna> -<pos de las columnas=&quot;6&quot;> <simbolo de peso=&quot;guanina&quot;
peso=&quot;0,22934782608695653&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,21630434782608696&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,17282608695652174&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,3815217391304348&quot; /> </columna> -<pos de las columnas=&quot;7&quot;> <simbolo de peso=&quot;guanina&quot;
peso=&quot;0,2597826086956522&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,22934782608695653&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,14673913043478262&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,3641304347826087&quot; /> </columna> -<pos de las columnas=&quot;8&quot;> <simbolo de peso=&quot;guanina&quot;
peso=&quot;0,2076086956521739&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,20326086956521738&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,1858695652173913&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,40326086956 </columna> -<pos de las columnas=&quot;9&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,19021739130434784&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,225&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,1815217391304348&quot; /> <simbolo de peso=&quot;timina&quot; peso=&quot;0,4032609695652174&quot; />
</columna> -<pos de las columnas=&quot;10&quot;> <simbolo de peso=&quot;guanina&quot; peso=&quot;0,29456521739130437&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,20326086956521738&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,15543478260869564&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,34697391304347826&quot; /> </columna> -<pos de las columnas=&quot;11&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,2510869565217391&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,19456521739130436&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,15108695652173912&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,4032608695652174&quot; /> </columna> -<pos de las columnas=&quot;12&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,2467391304347826&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,225&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,14673913043478262&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,3815217391304348&quot; /> </columna> -<pos de las columnas=&quot;13&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,2728260869565217&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,159782608769565217&quot; /> <simbolo de peso=&quot;adenina&quot;
peso=&quot;0,225&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,3423913043478261&quot; /> </columna> -<pos de las columnas=&quot;14&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,2858695652173913&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,19456521739130436&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,1858695652173913&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,33369565217391306&quot; /> </columna> -<pos de las columnas=&quot;15&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,2597826086956522&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,1858695652173913&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,15978260869565217&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,39456521739130435&quot; /> </columna> -<pos de las columnas=&quot;16&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,3641304347826087&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,19021739130434784&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,19021739130434784&quot; /> <simbolo de peso=&quot;timina&quot; peso=&quot;0,2554347826086957&quot; /> </columna> -<pos de las columnas=&quot;17&quot;> <simbolo de peso=&quot;guanina&quot; peso=&quot;0,2684782608695652&quot; />
<simbolo de peso=&quot;citosina&quot; peso=&quot;0,27717391304347827&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,20326086956521738&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,2510869565217391&quot; /> </columna> -<pos de las columnas=&quot;18&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,2554347826086957&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,22934782608695653&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,15108695652173912&quot; /> <simbolo de peso=&quot;timina&quot; peso=&quot;0,3641304347826087&quot; />
</columna> </matriz de pesos> </posicionado> </limitaci6n> -<limitaci6n de peso=&quot;7,430703153194244&quot; no logaritmico=&quot;falso&quot;>
-
<posici6n posicionada=&quot;-22&quot; max=&quot;verdadero&quot;> <ancho de la distribuci6n gaussiana=&quot;7,116598573800258&quot;
compensaci6n=&quot;0&quot; /> -<inversa de la matriz de pesos=&quot;0,0� normalizado por maximo=&quot;falso&quot; alfabeto=&quot;ADN&quot; columnas=&quot;5&quot;>
-
<pos de las columnas=&quot;0&quot;> <simbolo de peso=&quot;guanina&quot; peso=&quot;0,1261574074074074&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,12152777777777778&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,5520833333333333&quot; /> <simbolo de peso=&quot;timina&quot; peso=&quot;0,20023148148148148&quot; /> </columna>
-
<pos de las columnas=&quot;1&quot;> <simbolo de peso=&quot;guanina&quot; peso=&quot;0,18171296296296297&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,18634259259259296&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,35300925925925924&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,2789351851851852&quot; /> </columna> -<pos de las columnas=&quot;2&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,18171296296296297&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,14004629629629628&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,20949074074074073&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,46875&quot; /> </columna> -<pos de las columnas=&quot;3&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,10763888888888888&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,09375&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,5983796296296297&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,20023148148148148&quot; /> </columna> -<pos de las columnas=&quot;4&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,16782407407407407&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,1863425925925926&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,5335648148148148&quot; />
<simbolo de peso=&quot;timina&quot; peso=&quot;0,11226851851851852&quot; />
</columna> </matriz de pesos> </posicionado> </limitaci6n> -<limitaci6n de peso=&quot;20,800433402457763&quot; no logaritmico=&quot;falso&quot;>
-
<posici6n posicionada=&quot;309&quot; max=&quot;falso&quot;>
<ancho de la distribuci6n gaussiana=&quot;123,21919574445802&quot; compensaci6n=&quot;0&quot; />
-
<inversa de la matriz de pesos=&quot;0,0&quot; normalizado por maximo=&quot;falso&quot; alfabeto=&quot;ADN&quot; columnas =&quot;4&quot;> -<pos de las columnas=&quot;0&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,5205858504341704&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,1598047165219432&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,1598047165219432&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,1598047165219432&quot; /> </columna> -<pos de las columnas=&quot;1&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,1525271710220418&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,1525271710220418&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,5424184869338746&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,1525271710220418&quot; /> </columna> -<pos de las columnas=&quot;2&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,5571014456775343&quot; /> <simbolo de peso=&quot;citosina&quot;
peso=&quot;0,14763285144082192&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,14763285144082192&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,14763285144082192&quot; /> </columna> -<pos de las columnas=&quot;3&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,141013450947342&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,5769596947157973&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,1410134350947342&quot; /> <simbolo de peso=&quot;timina&quot; peso=&quot;0,1410134350947342&quot; />
</columna> </matriz de pesos> </posicionado> </limitaci6n> -<limitaci6n de peso=&quot;13,776783968061828&quot; no logaritmico=&quot;falso&quot;>
-<posici6n posicionada=&quot;-29&quot; max=&quot;verdadero&quot;> <ancho de la distribuci6n gaussiana=&quot;17,24379973438928" compensaci6n=&quot;0&quot; /> -<inversa de la matriz de pesos=&quot;0,0"
normalizado por maximo=&quot;falso&quot; alfabeto=&quot;ADN" columnas =&quot;6&quot;> -<pos de las columnas=&quot;0&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,17708333333333331&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,21875&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,4270833333333333&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,17708333333333331&quot; /> </columna> -<pos de las columnas=&quot;1&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,22337962962962962&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,14467592592592593&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,3761574074074074&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,25578703703703703&quot; /> </columna> -<pos de las columnas=&quot;2&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,19560185185185183&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,13541666666666666&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,14004629629629628&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,5289351851851851&quot; /> </columna> -<pos de las columnas=&quot;3&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,15393518518518517&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,16782407407407407&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,505787037037037&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,1724537037037037&quot; /> </columna> -<pos de las columnas=&quot;4&quot;>
<simbolo de peso=&quot;guanina&quot; peso=&quot;0,24652777777777776&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,16782407407407407&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,42245370370370366&quot; /> <simbolo de peso=&quot;timina&quot;
peso=&quot;0,16319444444444445&quot; /> </columna> -<pos de las columnas=&quot;5&quot;>
<simbolo de peso=&quot;guanina&quot; 5 peso=&quot;0,13541666666666666&quot; /> <simbolo de peso=&quot;citosina&quot; peso=&quot;0,19560185185185183&quot; /> <simbolo de peso=&quot;adenina&quot; peso=&quot;0,5567129629629629&quot; /> 10 <simbolo de peso=&quot;timina&quot; peso=&quot;0,11226851851851852&quot; />
</columna> </matriz de pesos> </posicionado>
15 </limitaci6n> </modelo>
Tabla 2
9590
AKAP12 6q24-q25 Proteina (gravina) 12 AKAP250lDKFZp686M0430lDKFZp68600331 HGNC:370lMIM:604698lHPRD:05263
de anclaje a la cinasa A
(PRKA)
208
AKT2 19q13.1-q13.2 Hom6logo 2 del PKBBETAlPRKBBlRAC-BETA HGNC:392lMI:164731lHPRD:01262
oncogen virico de
timoma murino v-akt
324
APC Poliposis coli DP2lDP2.5lDP3lFAPlFPClGS HGNC:583lMIM:175100lHPRD:01439
adenomatosa
578
BAK1 6p21.3 Antagonista/destructor BAKlBCL2L7lCDN1lMGC117255 HGNC:949lMIM:600516lHPRD:02744
1 de BCL2
581
BAX 19q13.3-q13.4 Proteina X asociada a Bax zeta HGNC:959lMIM:600040lHPRD:02498
BCL2
596
BCL2 18q21.33l18q21. CLL/linfoma 2 de Bcl-2 HGNC:990lMIM:151430HPRD:01045
linfocitos B
10904
BLCAP 20q11.2-q12 Proteina asociada al BC10 HGNC:1055lHPRD:16552
cancer de vejiga
672
BRCA1 17q21 Cancer de mama 1, BRCAIlBRCC1lIRISlPSCPlRNF53 HGNC:1100lMIM:113705lHPRD:00218
aparici6n temprana
675
BRCA2 13q12.3 Cancer de mama 2, BRCC2lFACDlFADlFAD1lFANCBl FANCDlFANCD1 HGNC:1101lMIM:600185lHPRD:02554
aparici6n temprana
60500
BRCA3 13q21 Cancer de mama 3 BRCAXlCancer de mama, tipo 3 HGNC:18617lMIM:605365
1116
CHI3L1 1q32.1 Proteina 1 similar a GP39lHC-gp39lHCGP-3PlYKL40 HGNC:1932lMIM:601525lBPRD:03314
quitinasa 3
(glicoproteina de
cartilago 39)
1620
DBC1 9q32-q33 Proteina 1 eliminada en DBCCR1lFAM5A HGNC:2687lMIM:602865lHPRD:04181
cancer de vejiga
1630
DCC 18q21.3 Eliminada en CRC18lCRCR1 HGNC:2701lMIM:120470lHPRD:00391
carcinoma colorrectal
8788
DLK1 14q32 Hom6logo 1 similar a FA1lPREF1lPref-1lZ0GlpG2 HGNC:2907lMIM:176290l:01446
delta (Drosophila)
9170
EDG4 19p12 Diferenciaci6n EDG-4lLPA2lLPAR2 HGNC:3168lMIM:605110
endotelial, receptor
acoplado a la proteina
G lisofosfatidica, 4
35 36 37
23566
EDG7 1p22.3-p31.1 Diferenciaci6n endotelial, receptor acoplado a la proteina G lisofosfatidica, 7 Edg-7lGPCRlH0FNH30lLP-A3lLPA3lLPAR3lRP4-678I3 HGNC:14298lMIM:605106lHPRD:05486
2064
ERBB2 17q11.2-17q11.2q12l17q21.1 Hom6logo 2 del oncogen virico de leucemia eritroblastica HER-2-HER-2/neulHER2lNEUlNGLlTKR1lc-erb B2 HGNC:3430lMIM:164870lHPRD:01281
2066
ERBB4 2q33.3-q34 v-erb-b2, hom6logo de oncogen derivado de neuro/glioblastoma (aviar) Hom6logo 4 del oncogen virico de leucemia eritroblastica HER4 HGNC:3432lMIM:600543lHPRD:02767
51013
EX0SC1 10q24 v-erb-a (aviar) Componente de 1 CGI-108lCSL4lCs14plSKI4lSki4plhCsl4plp13 HGNC:17286lMIM:606493lHPRD:16223
exosoma
2353
F0S 14q24.3 Hom6logo del oncogen virico de osteosarcoma c-fos ASMlASM1lBWSlD1lS813ElMGC HGNC:3796lMIM:164810lHPRD:01275
murino v-fos FBJ
283120 3726 3814
H19 JUNB KISS 1 11p15.5 19p13.2 1q32 H19, ARNm sin traducir expresado maternalmente impreso Protoncogen jun B Supresor de la metastasis KiSS-1 4485lPR02605lproteina predicha de HQ2605 -KiSS-1lMGC39258 HGNC:4713lMIM:103280 HGNC:6205lMIM:165161lHPRD:01303 HGNC:6341lMIM:603286lHPRD:04475
5653
KLK6 19q13.3 Calicreina 6 (neurosina, cima) BssplKlk7lMGC9355lNEUR0SINAlP RSS18lPRSS9lSP59lZYMElhK6 ERKlERK2lERT1lMAPK2lP42MA HGNC:6367lMIM:602652lHPRD:04037
5594 4292
MAPK1 MLH1 22q11.2l22q11.2 1 3p21.3 Proteina cinasa 1 activada por mit6geno Hom6logo 1 mutL, cancer de colon, no PKlPRKM1lPRKM2lp38lp40lp41lp 41mapk C0CA2lFCC2lHNPCClHNPCC2lMGC5172lhMLH1 ALL HGNC:6871lMIM:176948lHPRD:01496 HGNC:7127lMIM:120436lHPRD:00390
4297
MLL 11q23 poliposis de tipo 2 (E. coli) Leucemia de linaje mieloide/linfoide o mixto (hom6logo de Trithorax, Drosophila) 1lCXXC7lHRXlHTRX1lMLL1AlT RX1 HGNC:7132lMIM:159555lHPRD:01162 50
94025 4609
MUC16 MYC 19q13.2 8q24.12-q24.13 Mucina 16 Hom6logo del oncogen virico de CA125lFLJ14303 c-Myc HGNC:15582lMIM:606154 50 HGNC:7553lMIM:190080lHPRD:01818
mielocitomatosis v-myc (aviar)
4830 5292 5652 6667
NME1 PIM1 PRSS8 SP1 . 17q21.3 6p21.2 16p11.2 12q13.1 Celulas 1 no metastasicas, proteina (NM23A) expresada en 0ncogen pim-1 Proteasa, serina, 8 (prostasina) Factor de transcripci6n Sp1 AWDlGAADlNDPKAlNM23lNM2 3-H1 PIM CAP1lPR0STASINA - HGNC:7849lNEM:156490lHPRD:01131 HGNC:8986lMIM:164960lHPRD:01292 HGNC:9491lMIM:600823lHPRD:02895 HGNC:11205lMIM:189906lHPRD:01796
7124 7157 54997
TNF TP53 TSC 6p21.3 17p13.1 12q24.22 Factor de necrosis tumoral (superfamilia de TNF, miembro 2) Proteina p53 tumoral (sindrome de Li-Fraumeni) Proteina hipotetica FLJ20607 DIFlTNF-alfalTNFAlTNFSF2 LFS1lTRP53lp53 FLJ20607 HGNC:11892lMIM:191160lHPRD:01855 HGNC:11998lMIM:191170lHPRD:01859 HPRD:11649
7409 7428 7490 7535
VAV1 VHL WT1 ZAP70 19p13.2 3p26-p25 11p13 2q12 0ncogen vav 1 Supresor de tumores de von Hippel-Lindau Tumor 1 de Wilms Proteina cinasa asociada a la cadena VAV HRCA1lRCA1lVHL1 GUDlWAGRlWIT-2lWT33 SRKlSTDJTZKlZAP-70 HGNC:12657lMIM:164875lHPRD:01284 HGNC:12687lMIM:608537 HGNC:12796lMIM:607102lHPRD:06163 HGNC:12858lMIM:176947lHPRD:01495
zeta (TCR) de 70kDa

Claims (7)

  1. REIVINDICACIONES
    1. Procedimiento de diagn6stico de un cancer por detecci6n de expresi6n genica anormal en un individuo que comprende determinar en una muestra del individuo la presencia de una conformaci6n cromos6mica anormal, caracterizandose dicha conformaci6n cromos6mica anormal por
    (i)
    la presencia de una nueva yuxtaposici6n que no esta presente durante la expresi6n normal, o
    (ii)
    la ausencia de al menos una yuxtaposici6n que esta presente durante la expresi6n genica normal,
    en el que dicha yuxtaposici6n es de dos regiones separadas de un gen, para asi diagnosticar si el individuo tiene cancer.
  2. 2.
    Procedimiento segun la reivindicaci6n 1 en el que dicha conformaci6n cromos6mica es un bucle o una estructura topol6gicamente cerrada.
  3. 3.
    Procedimiento segun una cualquiera de las reivindicaciones precedentes, en el que dos o mas genes que participan en cancer se analizan para permitir el diagn6stico del tipo de cancer y/o al menos uno de los genes que se analiza es un gen especifico de tejido que permite que se identifique el tejido en el que se produce la expresi6n anormal.
  4. 4.
    Procedimiento segun una cualquiera de las reivindicaciones precedentes que comprende detectar la conformaci6n cromos6mica por determinaci6n de si las secuencias en el gen se han puesto en yuxtaposici6n o no por la asociaci6n de marcadores CC en el gen, y/o en el que la yuxtaposici6n se detecta por:
    -
    reticulaci6n de AND yuxtapuesto, seguido de -detecci6n del ADN reticulado, opcionalmente por medio de un procedimiento de detecci6n basado en
    secuencias, en el que dichos marcadores CC tienen 5 a 30 nucle6tidos de longitud.
  5. 5.
    Procedimiento segun la reivindicaci6n 4, en el que despues de reticularse el ADN, -el ADN reticulado se somete a digesti6n por restricci6n, -la estructura digerida se somete a ligaci6n, y -la estructura ligada se analiza/detecta.
  6. 6.
    Procedimiento segun la reivindicaci6n 5, en el que el analisis de la estructura ligada comprende la detecci6n de una secuencia de ADN presente en la estructura ligada que no esta presente en el gen.
  7. 7.
    Procedimiento segun la reivindicaci6n 6, en el que la secuencia de ADN presente en la estructura ligada se detecta por secuenciaci6n o por PCR, en el que opcionalmente la presencia de la secuencia ligada se detecta usando una reacci6n de PCR en la que los cebadores forman satisfactoriamente un producto de PCR usando la secuencia ligada como molde, pero no amplifican la secuencia del gen bajo las mismas condiciones de PCR.
ES07712741T 2006-02-17 2007-02-19 Conformación de adn (estructuras de bucle) en expresión génica normal y anormal. Active ES2368767T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0603251.0A GB0603251D0 (en) 2006-02-17 2006-02-17 DNA conformation
GB0603251 2006-02-17

Publications (1)

Publication Number Publication Date
ES2368767T3 true ES2368767T3 (es) 2011-11-22

Family

ID=36142050

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07712741T Active ES2368767T3 (es) 2006-02-17 2007-02-19 Conformación de adn (estructuras de bucle) en expresión génica normal y anormal.

Country Status (16)

Country Link
US (2) US9777327B2 (es)
EP (1) EP1991697B1 (es)
JP (1) JP5345857B2 (es)
CN (1) CN101384734B (es)
AT (1) ATE519864T1 (es)
AU (1) AU2007216315B2 (es)
CA (1) CA2642331C (es)
DK (1) DK1991697T3 (es)
ES (1) ES2368767T3 (es)
GB (1) GB0603251D0 (es)
HK (1) HK1125416A1 (es)
MY (1) MY182608A (es)
NO (1) NO343718B1 (es)
NZ (1) NZ571201A (es)
WO (1) WO2007093819A2 (es)
ZA (1) ZA200807948B (es)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0603251D0 (en) 2006-02-17 2006-03-29 Isis Innovation DNA conformation
NZ586909A (en) 2008-01-23 2012-05-25 Herlev Hospital Ykl-40 as a general marker for non-specific disease
GB0810051D0 (en) * 2008-06-02 2008-07-09 Oxford Biodynamics Ltd Method of diagnosis
JP2012502285A (ja) 2008-09-15 2012-01-26 ヘルレフ ホスピタル 消化管癌のマーカーとしてのykl−40
KR101862756B1 (ko) * 2010-07-09 2018-05-30 세르겐티스 비.브이. 관심있는 3-d 게놈 영역 서열화 전략
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9567631B2 (en) 2012-12-14 2017-02-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA3216609C (en) 2012-08-14 2024-05-14 10X Genomics, Inc. Microcapsule compositions and methods
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10584381B2 (en) 2012-08-14 2020-03-10 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9411930B2 (en) * 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
CA2900543C (en) 2013-02-08 2023-01-31 10X Genomics, Inc. Partitioning and processing of analytes and other species
AU2014268710B2 (en) 2013-05-23 2018-10-18 The Board Of Trustees Of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
WO2015157567A1 (en) 2014-04-10 2015-10-15 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
EP4053292A1 (en) 2014-06-26 2022-09-07 10X Genomics, Inc. Methods of analyzing nucleic acids from individual cells or cell populations
CA2956925C (en) 2014-08-01 2024-02-13 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
CN114807307A (zh) 2014-10-29 2022-07-29 10X 基因组学有限公司 用于靶核酸测序的方法和组合物
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
BR112017014902A2 (pt) 2015-01-12 2018-03-13 10X Genomics Inc processos e sistemas para a preparação de bibliotecas de sequenciamento de ácido nucleico e bibliotecas preparadas usando os mesmos
WO2016134034A1 (en) 2015-02-17 2016-08-25 Dovetail Genomics Llc Nucleic acid sequence assembly
US11274343B2 (en) 2015-02-24 2022-03-15 10X Genomics, Inc. Methods and compositions for targeted nucleic acid sequence coverage
WO2016137973A1 (en) 2015-02-24 2016-09-01 10X Genomics Inc Partition processing methods and systems
US11807896B2 (en) 2015-03-26 2023-11-07 Dovetail Genomics, Llc Physical linkage preservation in DNA storage
JP2018518203A (ja) 2015-06-24 2018-07-12 オックスフォード バイオダイナミックス リミテッド エピジェネティックな染色体相互作用
AU2016341198B2 (en) 2015-10-19 2023-03-09 Dovetail Genomics, Llc Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
CN115369161A (zh) 2015-12-04 2022-11-22 10X 基因组学有限公司 用于核酸分析的方法和组合物
US10975417B2 (en) 2016-02-23 2021-04-13 Dovetail Genomics, Llc Generation of phased read-sets for genome assembly and haplotype phasing
GB201608000D0 (en) 2016-05-06 2016-06-22 Oxford Biodynamics Ltd Chromosome detection
JP7497976B2 (ja) 2016-05-13 2024-06-11 ダブテイル ゲノミクス エルエルシー 保存されたサンプルからの長距離連鎖情報の回復
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
KR102481242B1 (ko) 2016-12-01 2022-12-23 옥스포드 바이오다이나믹스 피엘씨 암 진단에서 후생적 염색체 상호 작용의 적용
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA3047888A1 (en) * 2016-12-23 2018-06-28 Oxford Biodynamics Limited Method for typing epigenetic chromosome interactions
EP4029939B1 (en) 2017-01-30 2023-06-28 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
US20180340169A1 (en) 2017-05-26 2018-11-29 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
SG11201901822QA (en) 2017-05-26 2019-03-28 10X Genomics Inc Single cell analysis of transposase accessible chromatin
EP3704274B1 (en) 2017-11-03 2024-04-17 Oxford BioDynamics PLC Genetic regulation of immunoresponse by chromosome interactions
CN111051523B (zh) 2017-11-15 2024-03-19 10X基因组学有限公司 功能化凝胶珠
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
SG11202009889VA (en) 2018-04-06 2020-11-27 10X Genomics Inc Systems and methods for quality control in single cell processing
WO2020180424A1 (en) 2019-03-04 2020-09-10 Iocurrents, Inc. Data compression and communication using machine learning
CA3160441A1 (en) * 2019-11-15 2021-05-20 Phase Genomics Inc. Chromosome conformation capture from tissue samples
CN114550817B (zh) * 2022-01-25 2022-12-23 云南大学 基于多特征的ctcf介导染色质环预测方法
CN114841294B (zh) * 2022-07-04 2022-10-28 杭州德适生物科技有限公司 一种检测染色体结构异常的分类器模型训练方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002220521A1 (en) 2000-11-29 2002-06-11 Statens Seruminstitut A screening assay for detecting chromosome rearrangements or recombinations
CN1231596C (zh) * 2001-12-27 2005-12-14 赵兴波 利用线粒体dna指纹进行动物遗传信息鉴定的方法
CN1515692A (zh) * 2003-01-02 2004-07-28 缪金明 “锚定点灯”式寡核苷酸芯片的检测技术
EP1713938A2 (en) 2004-02-09 2006-10-25 Thomas Jefferson University DIAGNOSIS AND TREATMENT OF CANCERS WITH MicroRNA LOCATED IN OR NEAR CANCER-ASSOCIATED CHROMOSOMAL FEATURES
US20060015264A1 (en) 2004-06-02 2006-01-19 Mcshea Andrew Interfering stem-loop sequences and method for identifying
KR101383593B1 (ko) * 2005-07-04 2014-04-09 에라스무스 유니버시티 메디칼 센터 염색체 입체형태 칩-상-포착(4c) 에세이
GB0603251D0 (en) 2006-02-17 2006-03-29 Isis Innovation DNA conformation

Also Published As

Publication number Publication date
NZ571201A (en) 2011-07-29
WO2007093819A3 (en) 2007-10-04
GB0603251D0 (en) 2006-03-29
CA2642331A1 (en) 2007-08-23
CN101384734A (zh) 2009-03-11
MY182608A (en) 2021-01-26
WO2007093819A2 (en) 2007-08-23
EP1991697B1 (en) 2011-08-10
DK1991697T3 (da) 2011-09-19
US9777327B2 (en) 2017-10-03
CN101384734B (zh) 2013-10-30
CA2642331C (en) 2018-06-19
AU2007216315B2 (en) 2012-10-04
HK1125416A1 (en) 2009-08-07
AU2007216315A1 (en) 2007-08-23
ATE519864T1 (de) 2011-08-15
NO20083957L (no) 2008-11-14
ZA200807948B (en) 2009-11-25
US20180080081A1 (en) 2018-03-22
US20090186352A1 (en) 2009-07-23
NO343718B1 (no) 2019-05-20
EP1991697A2 (en) 2008-11-19
JP5345857B2 (ja) 2013-11-20
US11384396B2 (en) 2022-07-12
JP2009526543A (ja) 2009-07-23

Similar Documents

Publication Publication Date Title
ES2368767T3 (es) Conformación de adn (estructuras de bucle) en expresión génica normal y anormal.
Zhu et al. Circular RNAs negatively regulate cancer stem cells by physically binding FMRP against CCAR1 complex in hepatocellular carcinoma
Jing et al. Tazarotene-induced gene 1 (TIG1) expression in prostate carcinomas and its relationship to tumorigenicity
Zanconato et al. Genome-wide association between YAP/TAZ/TEAD and AP-1 at enhancers drives oncogenic growth
Liu et al. Mutant SF3B1 promotes AKT-and NF-κB–driven mammary tumorigenesis
KR101618950B1 (ko) 피부 자극 물질 스크리닝용 조성물 및 이를 이용한 피부 자극 물질의 스크리닝 방법
Peyret et al. Functional toll-like receptor 4 overexpression in papillary thyroid cancer by MAPK/ERK–induced ETS1 transcriptional activity
Nam et al. Identification and validation of a five microRNA signature predictive of prostate cancer recurrence and metastasis: a cohort study
Rogers et al. Ectopic expression of Zmiz1 induces cutaneous squamous cell malignancies in a mouse model of cancer
JP2012503483A (ja) サイクリンd1−trop2キメラの発現を抑制することができるオリゴヌクレオチド配列、および医療分野におけるその使用
Aslam et al. MicroRNAs associated with initiation and progression of colonic polyp: A feasibility study
EP3475448B1 (en) Method and kit for detecting fusion transcripts
AU2009337963A1 (en) Prognosis of breast cancer patients by monitoring the expression of two genes
Aiderus et al. Transposon mutagenesis identifies cooperating genetic drivers during keratinocyte transformation and cutaneous squamous cell carcinoma progression
Watson et al. CIC-DUX4 expression drives the development of small round cell sarcoma in transgenic zebrafish: a new model revealing a role for ETV4 in CIC-mediated sarcomagenesis
Hong et al. Elevation of microRNA-365 impedes malignant behaviors of gastric cancer cells by inhibiting PAX6
Hanada et al. Expression profile of early lung adenocarcinoma: identification of MRP3 as a molecular marker for early progression
US10294476B2 (en) NEAT1 as a prognostic marker and therapeutic target for prostate cancer
Barraclough et al. Microarray analysis of suppression subtracted hybridisation libraries identifies genes associated with breast cancer progression
Almutairi et al. Cancer-Testis Gene Biomarkers Discovered in Colon Cancer Patients. Genes 2022, 13, 807
KR20230144890A (ko) 호르몬 불응성 전립선암의 새로운 표적 유전자 및 이의 용도
Zhu et al. Circular RNAs regulate cancer stem cells by FMRP against CCAR1 complex in hepatocellular carcinoma
CN111455049A (zh) LncRNA MEG3和MALAT1作为诊断胆囊癌的标志物的应用及其检测试剂盒
US20040203063A1 (en) Use of prostate tumor inducing gene for detection of cancer cells
CN116676394A (zh) SNP rs62065444位点作为靶点在制备检测和/或治疗卵巢癌的产品中的应用