MX2011003170A - Metodo para analizar conjuntos de secuencias repetidas en tandem d4z4 de acido nucleico y paquete correspondiente. - Google Patents

Metodo para analizar conjuntos de secuencias repetidas en tandem d4z4 de acido nucleico y paquete correspondiente.

Info

Publication number
MX2011003170A
MX2011003170A MX2011003170A MX2011003170A MX2011003170A MX 2011003170 A MX2011003170 A MX 2011003170A MX 2011003170 A MX2011003170 A MX 2011003170A MX 2011003170 A MX2011003170 A MX 2011003170A MX 2011003170 A MX2011003170 A MX 2011003170A
Authority
MX
Mexico
Prior art keywords
probe
probes
chromosome
repeated
sequence
Prior art date
Application number
MX2011003170A
Other languages
English (en)
Other versions
MX339866B (es
Inventor
Pierre Walrafen
Anne Vannier
Aaron Bensimon
Nicolas Levy
Original Assignee
Genomic Vision
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genomic Vision filed Critical Genomic Vision
Publication of MX2011003170A publication Critical patent/MX2011003170A/es
Publication of MX339866B publication Critical patent/MX339866B/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La presente invención se refiere a un método para analizar in vitro arreglos de D4Z4 repetidos en tándem de ácido nucleico contenido en ácido nucleico representativo de cromosomas, en particular en ácido nucleico representativo de cromosomas 4 y 10 humanos, y a un paquete por lo tanto. Dicho método es adecuado en particular para determinar el número de unidades D4Z4 repetidas en dichos arreglos repetidos de D4Z4. Dicho método se basa en estiramiento de ácido nucleico y en particular en Combinación Molecular y depende del uso de sondas, especialmente sondas de ácido nucleico, con un diseño particular. La invención se refiere también a un método para proporcionar herramientas para la diagnosis de distrofia muscular facioscapulohumeral (FSHD) y por lo tanto a un paquete de diagnosis. La invención se refiere además a un método para identificar eventos bioquímicos y/o genéticos en regiones que contienen tales arreglos repetidos en tándem.

Description

METODO PARA ANALIZAR CONJUNTOS DE SECUENCIAS REPETIDAS EN TANDEM D4Z4 DE ACIDO NUCLEICO Y PAQU ETE CORRESPONDIENTE La presente invención se refiere a un método para analizar arreglos repetidos en tándem de D4Z4 in vitro de ácido nucleico, que incluye analizar regiones más grandes que comprenden dichas repeticiones o que rodean a dichas repeticiones, contenidas en ácido nucleico representativo de cromosomas, y en particular para determinar in vitro el número de unidades repetidas de D4Z4 en dichos arreglos de repetición en tándem D4Z4. Dicho método comprende el uso de sondas, especialmente sondas de ácido nucleico, con un diseño particular.
La invención se refiere también a un método para proporcionar herramientas para . la diagnosis de la distrofia muscular facioscapulohumeral (FSHD) y a un paquete correspondiente para diagnostico.
La invención se refiere además a un método para identificar eventos bioquímicos y/o genéticos en regiones que comprenden tales arreglos repetidos en tándem , o en dichos arreglos repetidos en tándem.
La invención se refiere además a un paquete que comprende las sondas usadas para llevar a cabo un método de la invención y a una composición que comprende dichas sondas en solución .
La presente invención se basa en el estiramiento de ácido nucleico y en particular en el estiramiento obtenido mediante Peinado Molecular. El estiramiento de ácido nucleico, en particular ADN genómico proporciona ácidos nucleicos inmovilizados en hebras lineales y paralelas, y se realiza de preferencia con un factor de estiramiento controlado, en una superficie apropiada (por ejemplo, portaobjetos de vidrio con superficie tratada). Después de estirar, es posible unir y especialmente hibridar sondas de secuencia específica detectables, por ejemplo, mediante microscopía fluorescente (Lebofsky y Bensimon , 2006). Así, la cartografía física de un lugar puede visualizarse directamente, en un solo nivel de molécula. La longitud de las señales fluorescentes y/o su número, y su separación en el portaobjetos proporciona una lectura directa del tamaño y separación relativa de las sondas. En el caso de una repetición en tándem , la longitud de la señal de una sonda que híbrida en la secuencia repetida refleja el número de unidades repetidas. Durante la preparación de muestras para estiramiento, en particular de acuerdo con la tecnología de Peinado Molecular, el ADN genómico se rompe en ubicaciones al azar. Así, las moléculas de ADN analizadas son de longitud variable, con un promedio de aproximadamente 300 kb, las moléculas más largas que alcanzan varias megabases.
La tecnología de peinado molecular se ha descrito en varias patentes y publicaciones, incluyendo US 6,303,296, W09818959, WO0073503, US2006257910, US200403351 0, US61 30044, US6225055, US6054327, WO2008028931 y en Michalet et al . , 1 997; Herrick et al . , 2000; Conti et al. , 2001 ; Gad et al . , 2001 ; Lebofsky y Bensimon , 2005; Lebofsky y Bensimon, 2006.
La invención se refiere en particular a la aplicación de los métodos y productos descritos en el campo de detección de FSHD . Para una revisión reciente en la patología de FSH D, se puede hacer referencia a (van der Maarel et al . , 2007 y referencias en la misma . FSH D en la tercera más frecuente distrofia muscular (incidencia 1 /20,000. Clínicamente, la presentación incluye síntomas tales como debilidad de los fijadores de escápula, debilidad facial asimétrica, debilidad de faja pélvica, debilidades abdominales, de antebrazo y/o extensor de pie, entre otros aspectos. Es una enfermedad genética autosomal dominante, con casos esporádicos (no heredados) que representan entre 1 0% y 30% de los nuevos casos.
El sitio de FSHD fue mapeado en el cromosoma 4q35. Se mostró que una contracción de un arreglo repetido en tándem es un marcador genético de la susceptibilidad a la enfermedad o la ocurrencia de la misma. La unidad de secuencia repetida, denominada D4Z4, es de 3.3 kb de largo, y está presente, entre otros sitios, en la región telomérica del brazo largo del cromosoma 4. Los individuos con más de doce unidades repetidas en ambos cromosomas 4q no llevan FSHD, mientras que los individuos con arreglos de repetición más cortos en uno o dos alelos pueden llevar FSHD. Se mostró además que entre portadores de arreglos repetidos de tamaño FSH D, la enfermedad estaba asociada exclusivamente con un haplotipo específico de cromosoma 4q. Dos haplotipos de 4q, que ocurren con frecuencia de 50% en números redondos cada uno, 4qA y 4qB , difieren en las secuencias inmediatamente teloméricas con relación al arreglo repetido. Solamente aquéllos individuos con un arreglo repetido corto (< 12 unidades repetidas) en un cromosoma 4qA son susceptibles a la enfermedad.
Secuencias similares a las secuencias D4Z4 encontradas en el cromosoma 4q están presentes en varios otros sitios, con similitudes de secuencia de hasta 90% . La similitud entre las regiones teloméricas de cromosomas 4q y 10q es la más sorprendente. De hecho, los cromosomas 1 0q llevan también un arreglo repetido de D4Z4, una secuencia de -40 kb corriente arriba del arreglo altamente similar a la ubicación equivalente en 4q, y un extremo telomérico idéntico al extremo 4qA. Las unidades de secuencia de D4Z4 en 1 0q son -98% similares a aquéllas en 4q (Cacurri et al . , 1 998). Otros arreglos repetidos con secuencias similares a D4Z4 están ubicados en particular en el cromosoma Y.
Probablemente más del 95% de pacientes con fenotipo FSHD llevan un arreglo repetido corto en un cromosoma 4qA. Sin embargo, entre los individuos con tal alelo, la penetración de la enfermedad no es completa y la severidad clínica es muy variable (Van der Maarel et al . , 2007). Por una cosa, el tamaño del arreglo repetido parece estar correlacionado negativamente con la severidad y la penetración, con arreglos muy cortos (<4 unidades repetidas) que están asociados con las presentaciones más severas, y arreglos más largos (8 a 12 unidades repetidas) con fenotipo más moderado a normal (Van der Maarel et al . , 2007 y referencias en la misma). Sin embargo, otros factores están involucrados ciertamente. Los factores genéticos pueden incluir variaciones y/o rearreglos de secuencia en el alelo patogénico, o en cromosomas homólogos u otros determinantes genéticos. Por ejemplo individuos con un SSLP específico (polimorfismo de longitud de secuencia simple) corriente arriba del arreglo repetido se encuentra que son saludables, aunque lleven un alelo FSH D dimensionado (Lemmers et al . , 2007). Ocurren otros rearreglos en ésta región , tales como supresiones de varios tamaños de las secuencias centroméricas al arreglo repetido, lo cual puede o puede no incluir algunas de las repeticiones. En tales casos, la presencia de un alelo de tamaño FSHD en un cromosoma 4qA se traduce aún en un fenotipo FSHD (Lemmers et al . , 2003, Deak et al . , 2007).
Aunque la diagnosis cl ínica es bastante confiable, la diagnosis genética de FSHD es una necesidad para obtener la orientación genética importante. Además de la descripción genética más o menos compleja de una enfermedad de un solo gen, otros factores de reto para la diagnosis genética FSH D son la ocurrencia de mosaicismo somático (van der Maarel et al, 2000), un parámetro importante de orientación genética, y de recombinación entre regiones 4q y 10q (Lemmers et al . 1998). Estos eventos de recombinación conducen a fallas de diagnostico puesto que traducen a unidades repetidas de D4Z4 que llevan 4q con secuencias 1 0q y solamente la ubicación y el número de unidades repetidas son relevantes para el diagnostico, no sus secuencias. Sin embargo, la mayor parte de las pruebas de FSH D en rutina establecen unidades repetidas 4q- y 1 0q-D4Z4 distinguidas mediante sus secuencias en lugar de su ubicación .
De hecho, el establecimiento más común para pruebas genéticas para FSH D depende en la restricción de digestiones de enzima de ADN genómico y análisis de tamaño de fragmentos mediante electroforesis y manchado southern . Un establecimiento común es visualizar el tamaño del arreglo repetido entero con una sonda que reconoce todos los alelos 4q y 1 0q y en la presencia de un alelo de tamaño de FSHD para evaluar su ubicación con enzimas que digieren cualesquiera secuencias 4q- o 1 0q-D4Z4 específicamente, con base en sus diferencias de secuencia . Las sondas específicas para 4qA o 4qB pueden usarse para confirmar el haplotipo para un alelo 4q corto (Ehrlich et al . , 2006). También, puesto que la sonda usada para visualizar todos los alelos 4q y 1 0q híbrida en una región que algunas veces es eliminada , puede ser necesario confirmar la ausencia de un alelo FSHD usando una sonda que se híbrida en el arreglo repetido.
Esta familia de pruebas es muy tardada, requiriendo algunas veces varios turnos de electroforesis en gel de pulso-campo y en todos los casos el manchado southern, implicando la manipulación de radioactividad , larga migración y/o tiempo de exposición. De manera más importante, los resultados son ambiguos con frecuencia, especialmente para alelos del tamaño de la línea de frontera o en el caso de eventos de recombinación. Además, la detección de mosaicismo es no confiable y su sensibilidad es baja (en el mejor de los casos un mosaicismo puede ser detectado si es llevado por el 10% al 30% de las células) (vam der Maarel et al, 2000). También , en algunos casos la eliminación de la región centromérica del arreglo repetido puede no ser sospechado y la falla para detectar un alelo FSH D en tal caso puede conducir a la conclusión errónea de que no hay tal alelo.
Se han sugerido otros tipos de pruebas para ser capaz de superar estas limitaciones. Se ha descrito una prueba no radioactiva, pero tiene todas las otras desventajas de las pruebas típicas de mancha southern, con una sensibilidad y especificidad considerablemente reducidas (Kekou et al . , 2005). Una prueba con base en PCR de largo alcance, presumiblemente capaz de determinar el tamaño de arreglos repetidos ubicados en 4q de hasta 5 a 7 unidades repetidas se describió también (Goto et al . , 2006). Esta prueba tiene varias ventajas, principalmente en términos de tiempo, costo y facilidad de ejecución, sobre las pruebas de mancha southern . Sin embargo, tiene desventajas mayores, que incluyen la inhabilidad de detectar arreglos repetidos con más de 7 unidades repetidas, para distinguir cromosómeros 4qA de 4qB , para tener en cuenta el mosaicismo o para detectar casos variantes con , por ejemplo, eliminación de secuencias corriente arriba del arreglo repetido (Lemmers et al . , 2006). Además, depende de una divergencia sencilla de nucleótido entre secuencias 4q y 1 0q para distinguir arreglos ubicados en 4q y 1 0q, haciéndolo vulnerable a mutaciones de punto.
El método de la invención permite evaluar los tamaños y haplotipos de arreglos repetidos de D4Z4 de manera confiable, con resolución de una repetición , en una manera efectiva de tiempo y costo, y con ninguna de las restricciones de manipulación de radioactividad . Este método debe ser también altamente sensible al mosaicismo y toma en cuenta la recombinación de 4q/1 0q así como también otros casos variantes. El método de la invención permite también determinar más eventos bioquímicos o genéticos en este arreglo.
En el contexto de la invención, el peinado molecular u otros métodos de estiramiento de ácido nucleico, que permiten la visualización directa de ácido nucleico estirado, se puede aplicar exitosamente a la determinación de arreglos repetidos de D4Z4 y posiblemente para la diagnosis de FSHD, lo cual nunca fue sugerido antes.
Mas generalmente, la presente invención es la primera aplicación de Peinado Molecular a un caso de polimorfismo de número de copias para arreglos repetidos en tándem, donde se mide la longitud de la sonda repetida, en lugar de la repetición de un motivo de sondas .
Descripción Detallada de la Invención La presente invención se refiere a un método para analizar arreglos repetidos en tándem de D4Z4 in vitro de ácido nucleico que incluye analizar regiones más grandes que comprenden dichas repeticiones o que rodean a dichas repeticiones, contenidos en ácido nucleico representativo de cromosomas, en particular ácido nucleico representativo de cromosomas 4 y 1 0 humanos, y opcionalmente ácido nucleico de cromosomas Y. Dicho método es adecuado especialmente para determinar el número de unidades repetidas de D4Z4 en dichos arreglos repetidos D4Z4. Dicho método comprende un paso de hibridación de ácido nucleico representativo de dichos cromosomas con por lo menos las siguientes sondas: - una sonda o conjunto de sondas que es (son) específica(s) para arreglo(s) repetido(s) en tándem D4Z4; - una sonda o uno o varios conjuntos de sondas que permite(n) distinguir un cromosoma de otro, en particular el cromosoma 4 (4q) del cromosoma 1 0 ( 1 0q)¡ y - una sonda o uno o varios conjuntos de sondas que permite(n) distinguir un haplotipo de otro, en particular distinguir el haplotipo qA del haplotipo qB, y - opcionalmente, una sonda o uno o varios conjuntos de sondas que permiten distinguir el cromosoma Y del cromosoma 4 y/o del cromosoma 1 0.
En una modalidad particular, los arreglos repetidos D4Z4 son arreglos repetidos en tándem que se encuentran eri los cromosomas 4, 10 y/o Y humanos.
Por "análisis de arreglos repetidos en tándem D4Z4" o "el análisis de la organización de arreglos repetidos D4Z4" se quiere decir en la presente, en particular: - determinar el número de unidades repetidas D4Z4 en dichos arreglos repetidos D4Z4; y/o - determinar la orientación de las unidades repetidas D4Z4 en dichos arreglos repetidos D4Z4; - detectar y/o analizar rearreglos (en particular eliminaciones y/o inserciones de secuencias de nucleótidos) en dichos arreglos repetidos D4Z4 y/o en regiones encontradas en la vecindad o en regiones adyacentes o esencialmente adyacentes a dichos arreglos repetidos de D4Z4; y/o - analizar la metilación en particular la metilación CpG; y/o - analizar eventos bioquímicos, en particular replicación y/o transcripción y/o unión de factor de transcripción y/o unión de otras proteínas de unión de ADN , en dichos arreglos repetidos de D4Z4 y/o en regiones en la vecindad o en regiones adyacentes o esencialmente adyacentes a dichos arreglos de repetición de D4Z4.
Por "unidad repetida de D4Z4" se quiere decir en la presente cualquier secuencia denominada D4Z4, que está presente como una secuencia repetida en un cromosoma humano, especialmente en un arreglo repetido en tándem en particular en el brazo largo de los cromosomas 4 y 10 y opcionalmente en el cromosoma Y. Dicha unidad repetida D4Z4 es generalmente de 3.3 kb de longitud en el caso del arreglo repetido de D4Z4 del cromosoma 4. La composición de nucleótido de la unidad repetida D4Z4 se describe en Hewitt et al. , 1994 y Cacurri et al , 1 998.
El término "ácido nucleico" y en particular "ácido nucleico representativo de cromosomas" como se usa en la presente designa una o varias moléculas de cualquier tipo de ácido nucleico capaz de unirse a y estirarse sobre un soporte como se define en la presente, y más particularmente estirarse usando tecnolog ía de peinado molecular; moléculas de ácido nucleico incluyen ADN (en particular ADN genómico, especialmente ADN cromosómico o cADN ) y ARN (en particular mARN ). Una molécula de ácido nucleico puede ser de hebra sencilla o hebra doble, pero es preferible.
"Acido nucleico representativo de un cromosoma dado" significa que dicho ácido nucleico contiene la totalidad de la información genética o información esencial con respecto al propósito de la invención , que está presente en dicho cromosoma . En particular, es ADN cromosómico.
En una modalidad particular, la muestra de ácido nucleico usada para estirar es ADN genómico, en particular ADN genómico total o más preferiblemente ADN genómico cromosómico (ADN genómico nuclear) y/o sus fragmentos. El término "ácido nucleico" se usa en particular en la presente para designar un ácido nucleico representativo de uno o varios cromosomas y/o de uno o varios fragmentos de cromosomas. Dichos fragmentos pueden ser de cualquier tamaño, las moléculas más largas que alcanzan varias megabases. Dichos fragmentos están comprendidos generalmente entre 5 y 2,000 kb o 1 0 y 2,000 kb, de preferencia entre 5 y 1 ,000 kb o 5 y 500 kb, y más preferiblemente entre 20 y 500 kb y son en promedio de aproximadamente de 300 kb.
La muestra de ácido nucleico usada en el método de la invención se puede obtener de un fluido biológico o de un tejido de origen biológico, dicha muestra o tejido que se aisla por ejemplo de un humano (llamado también paciente en la presente) o un mamífero no humano.
Como se define en la presente, una sonda es un polinucleótido, un híbrido de ácido nucleico/polipéptido o un polipéptido, que tiene la capacidad de hibridar con ácido nucleico representativo de cromosomas como se define en la presente, en particular a ARN y ADN . Este término abarca moléculas de- ARN (en particular mARN) y ADN (en particular cADN o ADN genómico), ácido nuclear péptido (PNA), y dominios de proteína.
Una sonda de polinucleótido o una sonda de híbrido de ácido nucleico comprende o consiste generalmente de por lo menos 100, 300 , 500 nucleótidos, de preferencia de por lo menos 700, 800 o 900 nucleótidos, y más preferiblemente por lo menos 1 , 2, 3, 4 o 5 kb. Por ejemplo, se pueden usar sondas de 1 , 2, 3, 4, 5, 6, 7, 8, 9, 1 0, 1 1 , 1 2, 1 3, 1 4, 1 5 kb o más de 1 5 kb, en particular 30, 50 o 100 kb. En una modalidad particular, la longitud de las sondas usadas fluctúa desde 0.5 hasta 50 kb, de preferencia desde 1 hasta 30 kb y más preferiblemente desde 1 hasta 10 kb, desde 4 hasta 20 kb, desde 4 hasta 1 0 kb o desde 5 hasta 10 kb.
Como se usa en la presente, la "secuencia" de una sonda, cuando la sonda es un polipéptido, debe ser entendida como la secuencia a la cual se une específicamente dicho polipéptido. Así, en los párrafos relativos a las sondas en la presente solicitud, que son aplicables a sondas polipeptídicas, la referencia a "hibridación" en este contexto particular debe entenderse más bien como "unión" (para convenciencia "hibridación" en lugar "unión" se usa en la presente). Una sonda de polipéptido se une generalmente de manera específica a una secuencia de por lo menos 6 nucleótidos y más preferiblemente por lo menos 1 0, 1 5, 20 nucleótidos. Una sonda de polipéptido como se define en la presente puede ser en particular cualquier dominio de unión de ácido nucleico (especialmente un dominio de unión de ADN) de una proteína con especificidad de secuencia (es decir, que se une específicamente a regiones particulares de ácido nucleico). Por ejemplo, dicha sonda de polipéptido puede ser una enzima de restricción que ha sido modificada con el fin de que no escinda el ácido nucleico (en particular ADN ), un factor de transcripción o el dominio de unión de ADN de una meganucleasa.
En una modalidad particular, una sonda de la invención se hibrida a lo largo de su longitud entera con una región particular de ácido nucleico, en particular con los cromosomas 4, 1 0 o Y y/o con los cromosomas del haplotipo qA o qB.
Por "sonda específica para arreglos repetidos de D4Z4" o "sonda repetida" se quiere decir en la presente una sonda que hibrida específicamente con arreglos repetidos de D4Z4, es decir, una sonda que hibrida con arreglos repetidos de D4Z4 y no hibrida o no hibrida significativamente con otras regiones de ácido nucleico en los cromosomas 4, 1 0 e Y y así, se permite la detección de los arreglos repetidos de D4Z4 contenidos en la muestra de ácido nucleico. Dicha sonda hibrida por lo menos con arreglos repetidos D4Z4 que se encuentran en los cromosomas 4 humanos y más preferiblemente hibrida también con arreglos repetidos de D4Z4 que se encuentran en los cromosomas 1 0 humanos. Las sondas repetidas están diseñadas de preferencia de tal manera que por lo menos una de ellas híbrida con cualquier arreglo repetido de D4Z4, es decir, en particular con arreglos repetidos de D4Z4 que están ubicados en los cromosomas 4, 1 0 e Y. En una modalidad preferida dicha sondas repetidas pueden diseñarse para hibridar con la unidad repetida de D4Z4 y tiene la longitud de dicha unidad repetida D4Z4.
Las sondas que son específicas para arreglos repetidos de D4Z4 se denominan "sondas repetidas" . Las otras sondas se denominan "sondas de ubicación" o "sondas de localización" porque permiten la determinación de la posición de los arreglos repetidos de D4Z4, es decir, la localización de arreglos repetidos de D4Z4 en cromosomas particulares, por ejemplo en los cromosomas 4, 10 o Y y/o en cromosomas del haplotipo qA o aB .
Así, las sondas de ubicación usadas hibridan con por lo menos una región de ácido nucleico ubicada fuera de un arreglo repetido de D4Z4 y de preferencia híbrida solamente con regiones de ácido nucleico ubicadas fuera de un arreglo repetido de D4Z4.
En una modalidad particular, la secuencia de una sonda es por lo menos 99% complementaria, es decir, por lo menos 99% idéntica (por ejemplo 99.5%, 99.9% o 1 00% idéntica) o por lo menos 99% similar (por ejemplo 99.5% , 99.9% o 100% similar) a la secuencia de una porción de una hebra del ácido nucleico objetivo al cual se debe hibridar. Por ejemplo, como se describe después en la presente, en una modalidad, la sonda repetida o por lo menos una de las sondas repetidas es 99.9% (por ejemplo 99.5% , 99.9% o 100%) complementaria/idéntica o 99.9% (por ejemplo, 99.5% , 99.9% o 1 00%) similar a la secuencia de la unidad repetida de D4Z4 que está ubicada en una hebra de un cromosoma 4 o a la secuencia de una porción de dicha unidad repetida de D4Z4. " El término "secuencia complementaria" en el contexto de la invención significa secuencia "complementaria" y " reversa" o "inversa" , es decir, la secuencia de una hebra de ADN que uniría mediante interacción de Watson-Crick a otra hebra de ADN que comprende o que consiste de dicha secuencia.
Por "una porción de" una región particular, se quiere decir en la presente nucleótidos consecutivos de la secuencia de dicha región particular. Una porción de acuerdo con la invención puede comprender o consistir de por lo menos 1 5 o 20 nucleótidos consecutivos, de preferencia de por lo menos 1 00, 200, 300, 500 o 700 nucleótidos consecutivos y más preferiblemente por lo menos 1 , 2, 3, 4, o 5 kilobases (kb) consecutivas de dicha región particular. Por ejemplo, una porción puede comprender o consistir de 1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1 , 12, 1 3, 14, 1 5 kb consecutivas de dicha región particular.
En una modalidad particular, la sonda usada o por lo menos una de las sondas usada es una variante de nucleótido de la sonda que muestra una complementariedad o similitud de secuencia de 100% con una porción de una hebra del ácido nucleico objetivo. La secuencia de dicha variante puede tener por lo menos 70, 80, 85, 90 o 95% de complementariedad o similitud con la secuencia de 1 porción de una hebra del ácido nucleico objetivo. Dicha variante puede diferir en particular de la sonda que es 1 00% idéntica o complementaria en 1 a 20, de preferencia en 1 a 10, eliminaciones, inserciones y/o más preferiblemente sustituciones, en particular en 1 , 2, 3, 4, 5, 6, 7 , 8, 9 o 1 0 eliminaciones, inserciones y/o más preferiblemente sustituciones de nucleótido en la secuencia de nucleótido original . En una modalidad particular, la variante mantiene la capacidad de hibridar, en particular para hibridar específicamente, con la secuencia del ácido nucleico objetivo, de manera similar a la sonda que es 1 00% idéntica o 100% complementaria con una secuencia del ácido nucleico objetivo (en particular en las condiciones de hibridación definidas en la presente).
En una modalidad particular de la invención , las sondas o una o varias sondas usadas para llevar a cabo la invención , en particular las sondas repetidas, están etiquetadas. En general , las sondas repetidas o por lo menos una de las sondas repetidas está (están) etiquetada(s) con una o varias etiquetas (por ejemplo biotina) y las sondas de localización están etiquetadas con por lo menos una etiqueta diferente (por ejemplo digoxigenina). Dichas sondas se pueden etiquetar como se define en la presente y como se describe en la solicitud de patente WO 2008/028931 , la cual se incorpora en la presente por referencia .
Un conjunto de sondas como se usa en la presente consiste de por lo menos dos sondas. Por ejemplo, dicho conjunto de sondas puede consistir de 2 a 1 5 sondas (2, 3, 4, 5, 6, 7, 8, 9, 1 0, 1 1 , 1 2, 1 3, 1 4 o 1 5), de preferencia de 2 a 1 0 sondas o de 2 a 6 sondas y más preferiblemente de 2 a 4 o de 2 a 5 sondas. El número de sondas en un conjunto no excede usualmente de 1 0, 20 o 30 sondas; un conjunto de sondas consiste de preferencia de 5, 6, 7, 8, 9, o 1 0 sondas cuando mucho.
En una modalidad particular, el métodos de la invención comprende o consiste de los siguientes pasos: a) proporcionar un soporte en una muestra de ácido nucleico que comprende ácido nucleico representativo de cromosomas, que ha sido estirado previamente en hebras lineales y paralelas e hibridar dicho ácido nucleico con las sondas diferentes; b) detectar las señales de hibridación que corresponden a las diferentes sondas; y c) analizar la organización de arreglos repetidos de D4Z4 en ácido nucleico representativo de cromosomas, en particular determinar el número de unidades repetidas de D4Z4 en dichos arreglos repetidos de D4Z4.
La muestra de ácido nucleico se estira generalmente en un soporte en hebras lineales y paralelas usando un factor de estiramiento controlado. Por factor de estiramiento se quiere decir en la presente el factor de conversión que permite conectar distancias físicas medidas en el ácido nucleico estirado con la longitud de la secuencia de dicho ácido nucleico. Tal factor se puede expresar como X kb/pm. Por factor de estiramiento controlado se quiere decir en la presente una técnica para la cual el factor de estiramiento es suficientemente constante y uniforme para permitir la deducción confiable de la longitud de la secuencia de una señal de hibridación a partir de la longitud física medida, sin el uso de sondas de calibración en la muestra ensayada.
El estiramiento de la muestra de ácido nucleico se puede realizar en particular usando una técnica de peinado molecular. El peinado molecular se puede realizar de acuerdo con métodos publicados, en particular como se describe en WO 95/22056, WO 95/21939, WO 2008/028931 y en US 6,303,296 (la cual se incorpora a la presente por referencia) y Lebosky y Bensimon , 2005. Antes del estiramiento del ácido nucleico, la manipulación del ácido nucleico causa generalmente que la(s) hebra(s) de ácido nucleico se rompan en ubicaciones aleatorias.
Se pueden usar otros métodos de estiramiento de ADN como una alternativa al Peinado Molecular. Estos métodos incluyen, por ejemplo: - métodos con base en la extracción de ADN con detergente y/o alta concentración de sal, combinado o no con la incubación con un agente de intercalación y/o luz UV, derivados de los métodos denominados ECF-FISH (hibridación in situ de fibras fluorescentes de cromatina extendida), preparación de Halo y otros métodos descritos en (Heng et al. , 1 992; Haaf y Ward , 1 994; Wiegant et al . , 1992m Florijn et al . , 1 995; Vandraager et al. , 1998, Raap, 1 998, Palotie et al . , 1 996, Fransz et al. , 1996); y - métodos con base en el estiramiento de ADN a través de la acción de un flujo hidrodinámico o a través de tracción mecánica sobre las moléculas de ADN , mediante capilaridad , gravedad o fuerza mecánica, posiblemente en un dispositivo a escala micrométrica o nanométrica , el ADN que es inmovilizado o no en un soporte sólido, derivado de métodos denominados DI RVISH (hibridación visual directa), mapeado óptico y otros métodos descritos en Parra y Windle, 1 993; Raap, 1998; Heiskanen et al . , 1994; Heiskanen et al . , 1 995; Heiskanen et al . , 1996, Mann et al. , 1996, Schwartz et al . , 1 993; Samad et al . , 1995, Jing et al. , 1 998; Dimalanta et al . , Palotie et al . , 1 996, Larson et al. , 2006).
Pueden ser necesarias algunas adaptaciones, accesibles al experto en la técnica, para realizar los métodos descritos en la presente usando éstos métodos de estiramiento. Para la mayoría de estos métodos, el factor de estiramiento no está controlado, y es necesario, por lo tanto, incluir un medio de calibración con el fin de conectar las distancias físicas en las moléculas estiradas y la longitud de secuencia. Tal método de calibración puede ser, por ejemplo, incluir una sonda (o varias sondas) de longitud(es) de secuencia constante(s) conocidas, tal es medida(s) indicará(n ) la proporción de distancia/longitud de secuencia. Esta(s) sonda(s) puede(n) ser una de las sondas (incluyendo varias sondas) descritas en los conjuntos de sondas en la presente, por ejemplo una de las sondas específicas de cromosoma 4 o cromosoma 1 0, o también la sonda "común" para 4q y 10q en la región inmediatamente corriente arriba del arreglo repetido de D4Z4 descrito en los ejemplos en la presente. También, la resolución , la precisión de medición , número de etiquetas utilizables, pueden diferir en estos métodos del peinado molecular, lo cual puede implicar la modificación del diseño de la sonda. Ejemplos de cómo se puede lograr esto, se dan en la sección de los ejemplos.
El soporte sobre el cual se ha estirado el ácido nucleico puede ser cualquier soporte apropiado, en particular cualquier soporte apropiado para peinado molecular. El soporte puede consistir, por lo menos en la superficie, de un pol ímero orgánico o inorgánico, un metal , especialmente oro, un óxido o sulfuro de metal , un elemento semiconductor o un óxido de un elemento semiconductor, tal como óxido de silicio o una combinación de los mismos, tal como vidrio o una cerámica. Puede mencionarse más particularmente vidrio, superficie de silicio oxidado, grafito, mica y sulfuro de molibdeno.
Un "soporte" como se usa en la presente abarca un soporte sencillo tal como un portaobjetos, perlas, especialmente, perlas de pol ímero, pero también cualquier forma tal como una barra, una fibra o un soporte estructurado, y también partículas, ya sea de polvos, especialmente polvos de sílice, que además pueden hacerse magnéticos, fluorescentes o coloreados. El soporte es de manera ventajosa una superficie plana, por ejemplo una cubierta deslizante. De preferencia, el soporte tiene poca o ninguna fluorescencia.
La muestra de ácido nucleico se puede poner en contacto con diferentes sondas antes y/o después de ser estiradas en el soporte. Sin embargo, el paso de estiramiento se realiza generalmente antes del paso de hibridación con las diferentes sondas.
Si es necesario, en particular cuando las moléculas de ácido nucleico de la muestra son de doble hebra, la hibridación es precedida por un paso de desnaturalización del ácido nucleico y/o de las sondas. Así, en una modalidad particular de la invención, el ácido nucleico se estira primero en el soporte y después se desnaturaliza (si es necesario para proporcionar ácido nucleico de hebra sencilla) y se híbrida con las diferentes sondas. En otra modalidad particular, el ácido nucleico se desnaturaliza primero (si es necesario) y se híbrida con las diferentes sondas antes de ser estirado en el soporte.
Como se usa en la presente, el término "hibridación" o "híbrida con" abarca hibridación de alta astringencia; en varios pasos de lavado todas las sondas no hibridadas y la mayoría de las sondas hibridadas parcialmente son eliminadas por lavado.
Las condiciones de hibridación y lavado usadas en la presente permiten de preferencia que las secuencias de nucleótidos que son por lo menos 60% complementarias entre ellas permanezcan hibridadas entre ellas. De preferencia, las condiciones son tales que las secuencias que son por lo menos aproximadamente 70% , más preferiblemente por lo menos aproximadamente 80% , aún más preferiblemente por lo menos aproximadamente 85%, 90% 95% , 98% complementarias o 1 00% complementarias entre ellas típicamente permanecen hibridadas entre ellas, es decir, forman híbridos estables para el propósito de la detección .
Las condiciones astringentes son conocidas por la persona experta en la técnica. Ejemplos de tales condiciones se describen en Cell Biology, a Laboratory Handbook, 3a ed . , Parte F, Elsevier Academic Press, 2006.
Las condiciones de hibridación de alta astringencia corresponden en particular a condiciones de temperatura y resistencia iónica que permiten el mantenimiento de la hibridación entre dos moléculas de ADN de hebra sencilla que comparten 1 00% de identidad de secuencia. A manera de ilustración, las condiciones de hibridación de alta astringencia en el contexto de la invención son las siguientes: 1 ) hibridación durante 20 horas a 37°C en amortiguador de hibridación (50% formamida, 2X SSC, 0.5% SDS, 0.5% Sarcosyl , NaCI 1 0 mM , auxiliar de Bloque 30%) con 1 0 pg de ADN de esperma de arenque y 2.5 pg de ADN de CoM humano, seguido por 3 lavados de 5 minutos a 20°C en 2 x SSC + 50% formamida y 3 lavados de 5 minutos a 20°C en 2 x SSC.
Esas condiciones de hibridación pueden adaptarse por el experto en la técnica de acuerdo con los protocolos publicados en Lebofsky y Bensimon, 2006, Lebofsky, et al . , 2005; Conti et al . , 2001 ; Gad et al . , 2001 ; Herrick et al . , 2000; Michael et al . , 1 997.
En una modalidad particular de la invención, el paso b) incluye además la transcripción de las señales de hibridación en códigos. Ejemplos de códigos que se describen en la solicitud de patente WO 2008/028931 , que se incorpora en la presente por referencia.
En una modalidad particular del método de la invención , el paso b) incluye además obtener, para cada ácido nucleico de la muestra que muestra por lo menos una señal de hibridación que corresponde a una sonda repetida, información correspondiente a una o una combinación de las siguientes categorías: ( 1 ) tipificar las señales de hibridación que corresponden a sondas de localización, (2) la longitud de una o varias señales de hibridación, (3) la posición de uno o varios tipos de señales de hibridación con relación a un arreglo repetido de D4Z4, y (4) la distancia entre las dos señales de hibridación .
Por "obtener información" se quiere decir alcanzar algunos pasos (uno o varios) para obtener dicha información.
"Tipificar" señales de hibridación consiste en asociar una señal de hibridación particular que corresponde a sondas de localización o una sucesión de señales de hibridación que corresponden a sondas de localización con un cromosoma o haplotipo particular. En particular, dicha tipificación puede consistir en determinar si la presencia de una señal de hibridación particular o una sucesión de señales de hibridación pertenece a una firma de un cromosoma o haplotipo como se define en la presente.
Determinar "la posición de uno o varios tipos de señales de hibridación con relación a un arreglo repetido de D4Z4" puede consistir en evaluar si dichas señales de hibridación de una hebra de ácido nucleico están ubicadas en una región centromérica o en la región telomérica, en particular si son inmediatamente centroméricas o teloméricas con relación a la(s) señal(es) de hibridación que corresponden a un arreglo repetido de D4Z4 que se detecta(n) en dicha hebra de ácido nucleico. Adicional o alternativamente, esta expresión puede significar también medir la distancia que separa una o varias señales de hibridación correspondientes a la(s) señal(es) de localización y a la(s) señal(es) de hibridación correspondientes a un arreglo repetido de D4Z4 que se detecta(n) en la misma hebra de ácido nucleico.
Como se usa en la presente, el término "centromérico a" (respectivamente "telomérico a") o "centromérico con relación a" (respectivamente "telomérico con relación a") significa más cerca del centromero en el mismo brazo de cromosoma (respectivamente más cerca al telómero en el mismo brazo de cromosoma).
Como se usa en la presente, el término "corriente arriba" (respectivamente "corriente abajo") significa más cerca al telómero del brazo "p" (es decir, el brazo corto) en el mismo cromosoma (respectivamente más cerca al telómero del brazo "q" (es decir, el brazo largo) en el mismo cromosoma). Con estas definiciones, en el brazo largo de un cromosoma dado, "corriente arriba" y "centromérica a" tienen el mismo significado y "corriente abajo" y "telomérica a" tienen el mismo significado.
Como se usa en la presente, el término "inmediatamente" centromérico (respectivamente telomérico) significa (i) adyacente o esencialmente adyacente y (ii) centromérico (respectivamente telomérico). Algunos nucleótidos (por ejemplo, 1 , 2, 3, 4, 5, 6, 7, 8, 9, o 1 0) o algunas decenas de nucleótidos, en particular de 1 0 a 1 00 (por ejemplo, 1 0, 20, 30, 40, 50, 60, 70, 80, 90 o 100) nucleótidos pueden separar dos regiones que son "esencialmente adyacentes".
El término "distancia entre dos señales de hibridación" puede designar la distancia entre cualquier señal de hibridación detectada en una hebra de ácido nucleico y cualquier otra señal de hibridación detectada en la misma hebra de ácido nucleico, y en particular la distancia entre dos señales de hibridación consecutivas. Con el método de peinado molecular, dos señales de hibridación se consideran como estando en la misma hebra de ácido nucleico si están alineadas y separadas por menos de 500 Mb. Cada una de estas dos señales de hibridación puede corresponder a la misma de dos sondas diferentes, que pueden seleccionarse independientemente entre una sonda repetida y cualquier tipo de sondas de localización.
Por "la distancia entre una primera señal de hibridación y otra (por ejemplo una última) señal de hibridación", se quiere decir en la presente la distancia (i) entre el comienzo (o respectivamente el extremo) de dicha primera señal de hibridación y el final (o respectivamente el comienzo) de dicha otra señal de hibridación o (ii) entre el comienzo (o respectivamente el final ) de dicha primera señal de hibridación y el comienzo (o respectivamente el final ) de dicha otra señal de hibridación.
En una modalidad particular del método de la invención, el paso de detectar las señales de hibridación que corresponden a las diferentes sondas (paso b) incluye además (i) medir la longitud de cada señal de hibridación que corresponde a una sonda repetida y/o (ii) medir, para cada arreglo repetido D4Z4 detectado, la distancia entre la primera señal de hibridación que corresponde a una sonda repetida y la última señal de hibridación que corresponde a una sonda repetida en la misma hebra de ácido nucleico. En particular, se puede medir la longitud de cada señal de hibridación que corresponde a una sonda repetida híbrida, a lo largo de su longitud entera, con la secuencia total de la unidad repetida de un arreglo repetido D4Z4, como se describe después en la presente. El número de unidades repetidas D4Z4 en un arreglo repetido de D4Z4 puede ser deducido fácilmente a partir de la(s) longitud(es) medida(s), lo cual requiere opcionalmente uno o varios factores de corrección.
Alternativamente, el número de unidades repetidas D4Z4 en un arreglo repetido de D4Z4 se puede determinar contando simplemente el número de señales de hibridación correspondientes a la sonda repetida o a una sonda repetida como se describe más adelante en la presente.
En una modalidad particular, el paso b) del método de la invención incluye el uso de software para exhibir imágenes digitales de las señales de hibridación y para medir manualmente las longitudes de las señales de hibridación y/o las distancias entre señales de hibridación sucesivas.
En una modalidad particular, el paso b) del método de la invención incluye el uso de software de análisis de imágenes para detectar automáticamente señales de hibridación y medir las longitudes de las señales de hibridación y/o las distancias entre señales de hibridación sucesivas. Tal software puede comprender algoritmos de detección de señales tales como aquéllos descritos en Berlemont et al . , 2007, Berlemont et al . , 2007a, Verlemont et al . , 2007b y en la patente US 06/91 1 ,797.
En una modalidad particular, el paso b) del método de la invención incluye además establecer un histograma (es decir, una representación gráfica) de las longitudes de las señales de hibridación medidas, en particular un histograma de las longitudes de las señales de hibridación que corresponden a una sonda repetida y/o establecer un histograma de las distancias medidas entre dos señales de hibridación que corresponden a una sonda repetida.
En una modalidad particular, el paso b) del método de la invención incluye además un paso de determinación de la desviación estándar de las mediciones, en particular como se describe en la parte de ejemplos de la presente solicitud.
En una modalidad particular, el paso c) del método de la invención incluye el uso de software, en particular de software para análisis estad ístico.
En una modalidad particular, el paso c) del método de la invención comprende o consiste en identificar los arreglos repetidos de D4Z4 que están colocados en un cromosoma 4qA (organización de estos arreglos repetidos que se analiza mediante el método de la invención). El paso c) puede incluir además el paso de identificar los arreglos repetidos de D4Z4 que están colocados en un ácido nucleico derivado de un cromosoma no 4qA, es decir, en particular, en un cromosoma 4qB, en un cromosoma 10, y/o en un cromosoma Y, y determinar el número de unidades repetidas D4Z4 en cada uno de estos arreglos repetidos.
En una modalidad particular de la invención , se realizan varias mediciones (por ejemplo 5, 10, 20, 30, 40 o 50) de la longitud del arreglo repetido de D4Z4 para el mismo alelo de una muestra de ácido nucleico.
En una modalidad particular de la invención , se realizan varias mediciones del número de unidades repetidas D4Z4 para cada alelo 4qA, y para cada alelo 4qB contenido en la muestra de ácido nucleico de un paciente.
Por lo tanto, en una modalidad particular, la muestra de ácido nucleico usada corresponde a por lo menos aproximadamente 10 copias, de preferencia por lo menos 30 copias y más preferiblemente por lo menos 50 o 60 copias, por ejemplo de 25 a 500, de 25 a 300 o de 25 a 100 copias de un genoma y en particular de ADN cromosómico el cual ha sido estirado en un soporte apropiado. Se debe notar que aunque un genoma, en particular un genoma humano consiste usualmente de pares de cromosomas (23 pares para un genoma humano), la muestra de ácido nucleico estirado no siempre es homogénea. De hecho, puesto que el ácido nucleico se purifica generalmente, en particular antes de ser estirado, con frecuencia sucede que para cada copia de un genoma , solamente el ácido nucleico representativo de un cromosoma (alelo) en lugar de un ácido nucleico representativo de un par de cromosomas es estirado en el soporte apropiado.
En una modalidad particular, los criterios para la interpretación de los datos obtenidos son como se describen en la parte de los ejemplos de la presente solicitud y se deben entender como aplicables para varias modalidades.
En una modalidad particular de la invención , la sonda o conjunto(s) de sondas que permiten distinguir el cromosoma 4 del cromosoma 1 0 comprende o consiste de: - una sonda que es específica para el cromosoma 4 o (ii) una sonda o uno o varios conjuntos de sondas hibridan con el cromosoma 4, dicha sonda o cada uno de dichos conjuntos de sondas que se selecciona de tal manera que por la hibridación con el cromosoma 4, la posición de las sondas, una comparada con las otras, forma una firma que es específica para el cromosoma 4 y/o - (i) una sonda que es específica para el cromosoma 1 0 o (ii) una sonda o uno o varios conjuntos de sondas hibridan con el cromosoma 1 0, dicha sonda o cada uno de dichos conjuntos de sondas que se selecciona de tal manera que por hibridación con el cromosoma 10, la posición de las sondas, una en comparación con las otras, forma una firma que es específica para el cromosoma 1 0.
En una modalidad particular de la invención , si está presente, la sonda o el (los) conjunto(s) de sondas que permiten distinguir el cromosoma Y del cromosoma 4 y/o del cromosomal O, comprende o consiste de (i) una sonda que es específica para el cromosoma Y o (ii ) una sonda o uno o varios conjuntos de sondas hibridan con el cromosoma Y dicha sonda o cada uno de dichos conjuntos de sondas que se selecciona de tal manera que por hibridación con el cromosoma Y, la posición de las sondas, una en comparación con las otras, forma una firma que es específica para el cromosoma Y.
La "firma" de un dominio particular (específicamente de un cromosoma) resulta de un patrón de hibridación obtenido con por lo menos una sonda o con varias sondas diferentes, dicho patrón es específico y definido por el tamaño de la separación (espacio) entre dos sondas consecutivas, cuando hibridan , y/o mediante una sucesión de sondas y en particular de sondas diferentes . Como se i l ustra en l a parte de ejemplos de la presente solicitud , tal firma puede consistir, por ejemplo, de u na sucesión de varias sondas, (por ejemplo 4 sondas) de la misma longitud (I ) que están interespaciadas por espacios de la misma longitud , la longitud de estos espacios que es igual a la longitud (I ) de las sondas o de un tamaño d iferente.
Por "sondas diferentes" se quiere deci r en la presente sondas de tamaños diferentes y/o de secuencias diferentes y/o etiquetadas con por lo menos una etiqueta diferente.
La detección de la fi rma de un dominio de i nterés en un ácido nucleico indica la presencia de dicho dominio de i nterés en dicho ácido nucleico . De aqu í que, la detección de u na firma específica para cualquier cromosoma 4 o 10 o Y o específica para el haplotipo qA o q B en un ácido nucleico que comprende un arreglo repetido D4Z4 indica que dicho ácido nucleico es respectivamente un cromosoma 4, 1 0 o Y o un cromosoma del haploti po qA o qB o un fragmento de d icho cromosoma y así que dicho arreglo repetido D4Z4 está ubicado respectivamente en el cromosoma 4, 1 0 o Y o en un cromosoma del haplotipo qA o qB .
Como se usa en la presente, el térmi no (i ) "específico para el cromosoma 4" , (ii) "específico para el cromosoma 1 0" o "específico para el cromosoma Y", significa respectivamente (i ) específico para el cromosoma 4 con respecto al cromosoma 1 0 y también con respecto al cromosoma Y, (ii) específico para el cromosoma 1 0 con respecto al cromosoma 4 y también con respecto al cromosoma Y, y (ii i) específico para el cromosoma Y con respecto al cromosoma 4 y con respecto al respecto al cromosoma 1 0.
Por "una sonda específica para el cromosoma 4 (o el cromosoma 1 0) con respecto al cromosoma 1 0 (cromosoma 4 respectivamente) y también con respecto al cromosoma Y" se quiere decir en la presente una sonda que híbrida con el cromosoma 4 (cromosoma 1 0 respectivamente) y no con el cromosoma 10 (cromosoma 4 respectivamente), y tampoco híbrida con el cromosoma Y. De manera similar, "una sonda específica para el cromosoma Y con respecto al cromosoma 4 y con respecto al cromosoma 1 0" es una sonda que híbrida con el cromosoma Y y no con el cromosoma 4 y no con el cromosoma 1 0.
Como se usa en la presente, el término "una firma específica para el cromosoma 4 (o el cromosoma 1 0) con respecto al cromosoma 1 0 (cromosoma 4 respectivamente) y también con respecto al cromosoma Y" significa una firma que, por hibridación de la sonda o conjunto de sondas que forman dicha firma, se encuentra en el cromosoma 4 (cromosoma 1 0 respectivamente) y no en el cromosoma 1 0 (cromosoma 4 respectivamente) y no en el cromosoma Y. de manera similar, "una firma para el cromosoma Y con respecto al cromosoma 4 y con respecto al cromosoma 1 0" es una firma que, por hibridación de la sonda o conjunto de sondas que forman dicha firma , se encuentra en el cromosoma Y y no en el cromosoma 4 y no en el cromosoma 1 0.
En una modalidad particular de la invención , una sonda o uno o varios conjuntos de sondas que permiten distinguir el haplotipo qA del haplotipo qB comprende o consiste de: - (i) una sonda que es específica para el haplotipo qA o (ii) una sonda o uno o varios conjuntos de sondas que hibridan con cromosomas del haplotipo qA, dicha sonda o cada uno de dichos conjuntos de sondas que se selecciona de tal manera que por hibridación con dichos cromosomas, la posición de las sondas una en comparación con las otras forma una firma que es específica para el haplotipo qA; y/o - (i) una sonda que es específica para el haplotipo qB o (ii ) una sonda o uno o varios conjuntos de sondas que hibridan con cromosomas del haplotipo qB , dicha sonda o cada uno de dichos conjuntos de sondas que se selecciona de tal manera que por hibridación con dichos cromosomas, la posición de las sondas, una en comparación con las otras, forma una firma que es específica para el haplotipo qB .
Una "sonda que es específica para el haplotipo qA" (o para el haplotipo qB) significa en la presente una sonda que híbrida solamente con cromosomas del haplotipo qA (o cromosomas del haplotipo qB respectivamente), es decir, una sonda que híbrida con los cromosomas del haplotipo qA (cromosomas del haplotipo qB respectivamente) y no con cromosomas del haplotipo qB (cromosomas del haplotipo qA respectivamente).
Una "firma específica para el haplotipo qA" (o para el haplotipo qB) significa una firma que, por hibridación de la sonda o conjuntos de sondas que forma dicha firma, se encuentra en cromosomas del haplotipo qA (del haplotipo qB respectivamente) y no en cromosomas del haplotipo qB (del haplotipo qA respectivamente).
En una modalidad particular de la invención, la sonda que forma una firma específica para un cromosoma o haplotipo particular o por lo menos una sonda del conjunto de sondas (de preferencia cada sonda del conjunto de sondas) que forman una firma específica para un cromosoma o haplotipo particular híbrida con una secuencia que es específica para dicha cromosoma o haplotipo particular.
En una modalidad particular, las sondas de un conjunto de sondas que forman una firma de un dominio de interés particular se seleccionan de tal manera que cuando estas sondas se hibridan en dicho dominio de interés, el espacio entre cada una de estas sondas es de por lo menos 4 kb, de preferencia por lo menos 5 kb.
En una modalidad particular de la invención, la sonda que es específica para cualquiera, el cromosoma 4 o el cromosoma 1 0, la sonda que forma una firma específica para cualquier cromosoma 4 o cromosoma 1 0 respectivamente, o por lo menos una sonda del conjunto de sondas que forma una firma especifica para respectivamente cualquier cromosoma 4 o cromosoma 10 (de preferencia cada sonda del conjunto) híbrida con una región del brazo largo de cualquiera de cromosoma 4 o cromosoma 10 respectivamente, dicha región es centromérica con respecto al arreglo repetido D4Z4, por ejemplo respectivamente: - la región del brazo largo del cromosoma 4 que está colocada a por lo menos 45 (o 48, 50, o 60 kb), de preferencia a por lo menos 65 kb y más preferiblemente a por lo menos 65 kb y cuando mucho 100 kb corriente arriba del extremo centromérico del arreglo repetido D4Z4; o - la región del brazo largo del cromosoma 10 que está colocada a por lo menos 42 kb (o 45 kb o 50 kb), y de preferencia a por lo menos 42 kb (o 45 kb o 50 kb) y cuando mucho 75 kb corriente arriba del extremo centromérico de arreglo repetido D4Z4.
En una modalidad particular de la invención, la sonda que es específica para el cromosoma 4, la sonda que forma una firma específica para el cromosoma 4 o por lo menos una sonda del conjunto de sondas que forma una firma específica para el cromosoma 4 comprende o consiste de: i) una secuencia seleccionada entre secuencias que fluctúan desde las siguientes coordenadas con relación al NCBI construcción 36.1 secuencia de referencia humana: 1 91 08941 2 a 191 096843 (sonda 4q 1 ), 1 91 1 06888 a 191 1 16775 (sonda 4q2), 1 91 128570 a 1 91 1 38567 (sonda 4q3) y 191 148576 a 1 91 1 58554 (sonda 4q4); ii) una secuencia complementaria a la secuencia i); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii) bajo condiciones astringentes (en particular condiciones astringentes como se definen en la presente); iv) una variante de nucleótido de secuencia i); o v) una porción de cualquiera de las secuencias (i), (ii), (iii) o (iv), dicha porción que es como se define en la presente, en una modalidad particular de la invención , el conjunto de sondas que forma una firma específica para el cromosoma 4 comprende o consiste de varias sondas (es decir, dos o más de dos) que comprenden o consisten de cualquiera de la secuencia i) a v) antes mencionadas. Por ejemplo, dicho conjunto de sondas comprende o consiste de una sonda 4q 1 , una sonda 4q2, una sonda 4q3 y una sonda 4q4.
En una modalidad particular de la invención, la sonda que es específica para el cromosoma 10, la sonda que forma una firma específica para el cromosoma 1 0 o por lo menos una sonda del conjunto de sondas que forma una firma específica para el cromosoma 1 0 comprende o consiste de: i ) una secuencia seleccionada entre secuencias que fluctúan desde las siguientes coordenadas a la secuencia de referencia NCBI construcción 36.1 humana: 1 35247926 a 1 35252909 (sonda 1 0q1 ), 1 35257958 a 135262966 (sonda 1 0q2), 1 35267992 a 1 35272976 (sonda 10q3) y 1 35278058 a 1 35282988 (sonda 10q4); ii) una secuencia complementaria a la secuencia i); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii ) bajo condiciones astringentes (en particular condiciones astringentes como se definen en la presente); o iv) una variante de nucleótido de la secuencia i ); v) una porción de cualquiera de las secuencias (i ), (i¡ ), (iii) o (iv), dicha porción que es como se define en la presente.
En una modalidad particular de la invención, el conjunto de sondas que forma una firma específica para el cromosoma 10 comprende o consiste de varias sondas (es decir, dos o más de dos) que comprenden o consisten de cualquiera de las secuencias i) a v) antes mencionadas. Por ejemplo, dicho conjunto de sondas que comprende o consiste de una sonda 1 0q 1 , una sonda 1 0q2, una sonda 1 0q3, y una sonda 1 0q4.
En una modalidad particular de la invención , la sonda que es específica para el haplotipo qA o qB, la sonda que forma una firma específica para el haplotipo qA o qB o por lo una sonda del conjunto de sondas que forma una firma específica para el haplotipo qA o qB (de preferencia cada sonda del conjunto) híbrida con una región del brazo largo del cromosoma 4qA o 4qB respectivamente que es telomérico, en particular inmediatamente telomérico, con relación al arreglo repetido de D4Z4.
En una modalidad particular de la invención, la sonda que es específica para el haplotipo qA, la sonda que forma una firma específica para el haplotipo qA o por lo menos una sonda del conjunto de sondas que forma una firma específica para el haplotipo qA (de preferencia cada sonda del conjunto híbrida: - con el arreglo repetido de una secuencia beta-satélite que es inmediatamente telomérica con relación al arreglo repetido D4Z4 en el brazo largo del cromosoma 4qA o con una porción de esta secuencia beta-satélite dicha porción como se define en la presente; y/o - el arreglo repetido de aproximadamente 1 kb de unidades repetidas (TTAGGG)n que es inmediatamente telomérico con relación a dicho arreglo repetido de una secuencia beta-satélite en el brazo largo del cromosoma 4qA o con una porción de esta región , dicha porción que consiste de por ejemplo por lo menos 1 00, 200 o 300 pares de bases (bp), de preferencia por lo menos 500 o 700 (bp), y mas preferiblemente por lo menos 800 o 900 (bp); y/o - con la región de aproximadamente 750 bp (llamada qA1 en la Figura 4) que está ubicada aproximadamente a 2.5 kb corriente abajo del extremo telomérico de dicho arreglo repetido de beta-satélite en el brazo largo del cromosoma 4qA o con una porción de esta región , dicha porción que consiste de por ejemplo por lo menos 100, 200 o 300, de preferencia por lo menos 500 o 600 bp, y más preferiblemente por lo menos 700 bp; y/o - con la región de aproximadamente 750 bp (llamada qA1 en la Figura 4) que está ubicada aproximadamente a 2.5 kb corriente abajo del extremo telomérico de dicho arreglo repetido de beta-satélite en el brazo largo del cromosoma 4qA o con una porción de esta región , dicha porción que consiste de por ejemplo por lo menos 1 00, 200 o 300, de preferencia por lo menos 500 o 600 bp, y más preferiblemente por lo menos 700 bp; y/o - con la región que está ubicada por lo menos aproximadamente a 8.5 kb corriente abajo del extremo telomérico de dicho arreglo repetido de beta-satélite en el brazo largo del cromosoma 4qA, o con una porción de la misma, dicha porción que consiste de por ejemplo por lo menos 1 00, 200 o 300, de preferencia por lo menos 1 kb, por lo menos 1 .5 kb (por ejemplo 1 .9 kb) o por lo menos 2 o 5 kb. Dicha región abarca las regiones del cromosoma 4qA que se denominan qA2 y qA3 en la presente (ver en particular la Figura 4).
En una modalidad particular de la invención , la sonda que es específica para el haplotipo qA, la sonda que forma una firma específica para el haplotipo qA o por lo menos una sonda del conjunto de sondas que forma una firma específica para el haplotipo qA comprende o consiste de: i) una secuencia seleccionada entre secuencias que fluctúan a partir de las siguientes coordenadas con relación al número de acceso U 74496.1 de Genbank: 2756 a 3556 (sonda qA1 ) y 8723 a 10672 (sonda qA2); ii) una secuencia complementaria de la secuencia i ); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii ) bajo condiciones astringentes (en particular condiciones astringentes como se definen en la presente); iv) una variante de nucleótido de secuencia); v) una porción de cualquiera de las secuencias (i), (ii ), (iii) o (iv), dicha porción que es como se define en la presente.
En una modalidad particular de la invención, el conjunto de sondas que forma una firma específica para el haplotipo Ka comprende o consiste de varias sondas (por ejemplo, dos o más de dos) que comprenden o que consisten de cualquiera de las secuencias i) a v) antes mencionadas. Por ejemplo, dicho conjunto de sondas puede comprender o consistir de una sonda qA1 y una sonda qA2.
En una modalidad particular de la invención , la sonda que es específica para el haplotipo qB, la sonda que forma una firma específica para el haplotipo qB o por lo menos una sonda del conjunto de sondas que forma una firma específica para el haplotipo qB híbrida con la totalidad de la región de aproximadamente 6 kb qué es inmediatamente telomérica con relación al arreglo repetido D4Z4 en el brazo largo del cromosoma 4qB o con una porción de esta región , dicha porción que es como se define en la presente. Tal porción puede ser, por ejemplo, la región de aproximadamente 5.2 kb ubicada aproximadamente a 800 bp corriente abajo del extremo telomérico del arreglo repetido D4Z4 en el brazo largo del cromosoma 4qB, o la región de aproximadamente 4.5 kb ubicada aproximadamente a 1 .5 kb corriente abajo del extremo telomérico del arreglo repetido D4Z4 en el brazo largo del cromosoma 4qB o con una porción de una de estas regiones, dicha porción que es como se define en la presente.
En una modalidad particular de la invención , la sonda que es específica para el haplotipo qB, la sonda que forma una firma específica para el haplotipo qB o por lo menos una sonda del conjunto de sondas que forma una firma específica para el haplotipo qB comprende o consiste de: i) una secuencia seleccionada entre secuencias que fluctúan a partir de las siguientes coordenadas con relación a la secuencia de referencia NCBI construcción 36.1 humana: 1 91 252023 a 1 91 253372 (sonda qB 1 -3) y 1 91248879 a 1 91252040 (sonda qB 1 -4), o la única sonda formada de qB 1 -3 y qB 1 -4 que resulta en qB1 ; ii) una secuencia complementaria de la secuencia i); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii ) bajo condiciones astringentes (en particular condiciones astringentes como se definen en la presente); iv) una variante de nucleótido de la secuencia); o v) una porción de cualquiera de las secuencias (i), (ii), (iii) o (iv), dicha porción que es como se define en la presente.
En una modalidad en particular de la invención, el conjunto de sondas que forma una firma específica para el haplotipo qB comprende o consiste de varias sondas (por ejemplo dos o más de dos) que comprende o que consiste de cualquiera de las secuencias i) a v) antes mencionadas. Por ejemplo, dicho conjunto de sondas puede comprender o consistir de una sonda qB1 -3 y una sonda qB1 -4.
En una modalidad particular de la invención , la sonda repetida o por lo menos una de las sondas repetidas, y de preferencia cada sonda repetida, híbrida, ya sea con (i) a lo largo de su longitud completa, con la secuencia completa de la unidad repetida D4Z4 de un arreglo repetido de D4Z4, o (ii) de preferencia a lo largo de su longitud completa, con una porción de la unidad repetida D4Z4 de un arreglo repetido de D4Z4. En particular, dicha porción puede consistir de aproximadamente una mitad de dicha unidad repetida D4Z4 o ubicarse en un extremo de dicha unidad repetida D4Z4 o cerca de un extremo de dicha unidad repetida D4Z4.
En una modalidad particular de la invención , la sonda repetida o una de las sondas repetidas es de aproximadamente 3.3 kb de longitud .
En una modalidad particular de la invención , una o varias sondas repetidas comprende o consiste de: i) una secuencia seleccionada entre secuencias que fluctúan a partir de las siguientes coordenadas con relación al número de acceso U85056.1 : 2421 3 a 27507 (sonda DeeZee), 2421 3 a 25948 (sonda Dee) y 25763 a 27507 (sonda Zee); ii) una secuencia complementaria de la secuencia i ); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii ) bajo condiciones astringentes (en particular condiciones astringentes como se definen en la presente); iv) una variante de nucleótido de la secuencia i); o v) una porción de cualquiera de las secuencias (i), (ii ), (iii) o (iv), dicha porción que es como se define en la presente.
En una modalidad particular de la invención , la sonda repetida es una sonda DeeZee. En otra modalidad particular de la invención , se usan por lo menos dos sondas repetidas, en particular una sonda Dee y una sonda Zee. Las sondas Dee y Zee están contenidas en constructos proporcionados respectivamente como SEQ I D N° 1 y SEQ I D N° 2, donde parecen suplementados en cada uno de sus extremos, con unos pocos nucleotidos además de la secuencia respectiva de sonda Dee y Zee (posiciones indicadas), usadas para el constructo y que corresponden a sitios de restricción. Cada una de las sondas Dee y Zee contienen la mitad de la secuencia de la unidad repetida D4Z4 y se obtuvieron mediante síntesis novo.
En una modalidad particular, la variante de nucleótido de la secuencia (i) difiere de la secuencia (i) en 1 a 1 0, sustituciones de nucleótido, en particular en 1 , 2, 3, 4, 5, 6, 7, 8, 9 o 1 0 sustituciones de nucleótido.
Cuando la sonda repetida o por lo menos una de las sondas repetidas híbrida , a lo largo de su longitud completa , con la secuencia completa de la unidad repetida de un arreglo repetido de D4Z4, por ejemplo cuando se usa una sonda repetida de la secuencia DeeZee, el número de unidades repetidas D4Z4 en un arreglo repetido de D4Z4 puede determinarse mediante: 1 ) medir, para este arreglo repetido , la longitud (L) total de la señal de hibridación que corresponde a la sonda repetida de hibridación; y 2) calcular el número (n ) de unidades repetidas D4Z4 de d ichas unidades repetidas D4Z4 usando la proporción n = L/l , en donde I corresponde a la longitud de una unidad repetida D4Z4. L es generalmente igual a 3.3 kb .
Cuando la sonda repetida o por lo menos una de las sondas repetidas híbrida con una porción de una repetición de unidad D4Z4 (por ejemplo , tiene una longitud i nferior a 3.3 kb), se puede determinar el número de unidades repetidas D4Z4 en un arreglo repetido de D4Z4 contando el número de señales de hi bridación que corresponde a d icha sonda repetida en dicho arreglo repetido o midiendo la d istancia entre el comienzo de la primera señal de hi bridación que corresponde a una sonda repetida y el final de la últi ma señal de hibridación que corresponde a una sonda repetida en este arreglo repetido .
Además, usando por lo menos una sonda repetida que híbrida (a lo largo de su longitud com peta ) con una porción ubicada en un extremo de una unidad repetida o cerca de un extremo de una unidad repetida del arreglo repetido de D4Z4 permite la determinación de la orientación de cada una de la unidad repetida D4Z4 o de por lo menos algunas de estas unidades repetidas en un arreglo repetido de D4Z4. La determinación de la orientación de las unidades repetidas permite I determinación de repeticiones de D4Z4 invertidas lo cual puede ser de uso en la interpretación de los resultados de la detección.
En una modalidad particular de la invención, se usan varias sondas (por lo menos 2) repetidas diferentes. Generalmente (i) cada una de estas sondas repetidas híbrida con una región distinta de la unidad repetida D4Z4 en un arreglo repetido de D4Z4 y/o (ii) una de dichas sondas híbrida con una región de la unidad repetida D4Z4 que está incluida, totalmente o en parte, en la región de la unidad repetida D4Z4 que híbrida con otra de dichas sondas. Además, estas sondas repetidas son , de preferencia de tamaño diferente y/o etiquetadas con por lo menos una etiqueta diferente.
El traslape entre dos sondas repetidas que hibridan con diferentes regiones de la misma unidad repetida D4Z4 puede ser de cualquier tamaño comprendido entre 0 kb y la longitud de una unidad repetida, por ejemplo entre 0 y 3.3, especialmente, 1 00 bp o 500 bp.
En una modalidad particular, el método de la invención incluye detectar y analizar rearreglos en la región cercana a los arreglos repetidos de D4Z4, particularmente detectar eliminaciones de una porción de la región inmediatamente centromérica a los arreglos repetidos de D4Z4. Esta detección puede involucrar medir las distancias entre una o varias sondas centroméricas con el arreglo repetido y comparar con las distancias correspondientes esperadas de acuerdo con las secuencias de referencia que reflejan una región normal en la vecindad de los arreglos repetidos de D4Z4. Si se encuentra una distancia más corta que la esperada, es una indicación de una eliminación que ocurrió en las secuencias entre la sonda considerada y el arreglo repetido. La tipificación de estas señales puede permitir la definición de si la eliminación ocurrió en un cromosoma 4qA o en un cromosoma 4qB o 10q u opcionalmente en un cromosoma Y.
Alternativamente, se puede detectar una eliminación mediante la ausencia de una sonda en una firma de uno de los cromosomas o uno de los haplotipos. Alternativa o adicionalmente, se puede detectar una eliminación mediante una distancia más corta que la esperada entre varias sondas en una firma de uno de los cromosomas o de uno de los haplotipos.
Se pueden detectar inserciones tan largas que las distancias esperada entre sondas si las secuencias insertadas no están contenidas en las secuencias de las sondas usadas, y/o como la presencia de señales de hibridación inesperadas y/o tan largas como las longitudes esperadas de las sondas si las secuencias insertadas están contenidas en las secuencias de las sondas usadas. Como se describe en los ejemplos, la identificación de las secuencias insertadas puede involucrar hibridaciones adicionales con conjuntos de sondas modificados.
Así, en una modalidad particular, el método de la invención , incluye además hibridar el ácido nucleico a ser analizado son una o varias de las siguientes sondas, que están etiquetadas de preferencia (como se describe en la presente): - una sonda o un conjunto de sondas que híbrida con la región de aproximadamente 42 kb que es inmediatamente centromérica con relación al arreglo repetido de D4Z4 en el brazo largo del cromosoma 4 o con una porción de esta región y/o que híbrida con la región de aproximadamente 42 kb que es inmediatamente centromérica con relación al arreglo repetido de D4Z4 en el brazo largo del cromosoma 10 o con una porción de esta región; y/o - una sonda o conjunto de sondas que híbrida con la región de aproximadamente 1 5 kb que es inmediatamente telomérica con relación al arreglo repetido de D4Z4 en cromosomas del haplotipo qA y/o en cromosomas del haplotipo qB o con una porción de esta región .
En una modalidad particular, el método de la invención incluye un paso de análisis de la metilación, en particular metilación CpG , especialmente detectando regiones ricas en metilcitosina por ejemplo mediante la incubación de la muestra de ácido nucleico con uno o varios anticuerpos anti-metilcitosina (en particular anticuerpos monoclonales o policlonales). La muestra de ácido nucleico puede ser incubada con dichos anticuerpos antes o después de estirar la muestra de ácido nucleico en un soporte, pero se incuba de preferencia después del paso de estiramiento. Por ejemplo, dicha incubación puede realizarse conjuntamente con hibridación de sondas o de preferencia conjuntamente con anticuerpos usados para la detección de sondas hibridadas.
Los diseños de sonda descritos en la presente se pueden usar más generalmente para investigar otros eventos biológicos que ocurren en o cerca del sitio de FSHD u otros sitios que llevan arreglos repetidos de D4Z4, y en particular para estudiar la replicación de ADN en esos sitios. Así , en una modalidad particular, el método de la invención incluye además un paso de análisis de eventos bioquímicos, en particular cinética de replicación de ADN en particular, en las extremidades teloméricas de los brazos largos de los cromosomas 4 y/o 1 0. Por ejemplo, se pueden incubar células replicantes con nucleótidos modificados (tales como bromodeoxiuridina, clorodeoxiuridina, yododeoxiuridina) simultánea o sucesivamente. Dichos nucleótidos cuando se incorporan durante el proceso de replicación de ADN , se pueden detectar mediante la incubación del ácido nucleico de las células con uno o varios anticuerpos anti-bromodeoxiuridina, anti-clorodeoxiuridina y/o anti-yododeoxiuridina (en particular anticuerpos monoclonales o policlonales). La muestra de ácido nucleico puede ser incubada con dichos anticuerpos antes o después de estirar la muestra de ácido nucleico en un soporte, pero de preferencia se incuba después del paso de estiramiento. Por ejemplo , dicha incubación se puede realizar conjuntamente con la hibridación de sondas o de preferencia conjuntamente con anticuerpos usados para la detección de sondas hibridadas. Dichos nucleótidos modificados se pueden detectar con fluorocromos idénticos a o diferentes de los fluoróforos usados en la detección de sondas, pero de preferencia de detectan con flouorocromos diferentes a aquellos usados para la detección de sondas. Las estrategias para permitir la detección simultánea de nucleótidos modificados incorporados y sondas hibridadas se detallan en Lebofsky y Bensimon , 2006.
En una modalidad particular, el método de la invención incluye un paso para analizar otros eventos biológicos tales como transcripción , uniones de factor de transcripción y/o unión de otras proteínas de unión de ADN. Tal análisis requerirá adaptaciones específicas, que se pueden hacer fácilmente por el experto en la técnica .
Las etiquetas detectables adecuadas para uso en la presente invención incluyen cualquier composición detectable mediante espectroscopia, medios fotoquímicos, bioquímicos, inmunoquímicos, eléctricos, ópticos o químicos. En una modalidad particular de la invención , las sondas están etiquetadas con uno o varios (por ejemplo 2) elementos radioactivos (por ejemplo 3H , 125l , 35S, 35C o 32P) o elementos no radioactivos. Los elementos no radioactivos incluyen en particular fluorocromos (o fluoróforos) y otra etiquetación "fría" tales como haptenos (en particular biotina o digoxigenina (DI G)), enzimas químicas (por ejemplo, peroxidasa de rábano picante o fosfatasa alcalina) o marcadores quimio-luminiscentes, así como también con perlas, partículas o con dianas para anticuerpos.
En una modalidad particular, se usan etiquetas fluorescentes. Se puede usar cualquier fluorocromo, en particular los fluorocromos usados típicamente en aplicaciones de biotecnolog ía e investigación, incluyendo isocianato de fluoresceina (FITC), los colorantes Alexa Fluor producidos por Sondas Moleculares, tales como colorantes fluorescentes Alexa (A594), y colorantes DyLight Fluor producidos por Thermo Fisher Scientific o por Rockland Immunochemicals, Inc, el fluoroforo de Texas Red u otros fluoróforos que son derivados de la rodamina, cumarina o cianlna.
Las sondas pueden etiquetarse en particular mediante la incorporación de nucleótidos modificados que se revelan opcionalmente por separado, por ejemplo por incorporación de nucleótidos modificados mediante biotinilación, con DIG u otros haptenos que son revelados mediante un sistema de capas de anticuerpos o de moléculas específicas.
En una modalidad particular, las sondas se modifican para darles diferentes propiedades fisicoqu ímicas (tales como mediante metilación , etilación ). En otra modalidad particular, las sondas se pueden modificar para agregar un grupo funcional (tal como un grupo tiol), y opcionalmente inmovilizarse en perla (de preferencia perlas de vidrio).
Las etiquetas se pueden unir directamente o a través de una porción vinculadora. Por ejemplo, una etiqueta se puede unir a un nucleósido, nucleótido o análogo de los mismos en cualquier posición que no interfiera con la detección o la hibridación según se desee.
La(s) etiqueta(s) puede(n) incorporarse en las sondas mediante cualquier número de medios bien conocidos por aquellos expertos en la técnica. Por ejemplo teniendo el recurso de traducción nick o PCR o Random Priming usando nucleótidos etiquetados. La sonda (por ejemplo ADN) se puede amplificar, por ejemplo mediante reacción en cadena de polimerasa (PSR), en la presencia de nucleótido etiquetado, por ejemplo UTP etiquetado con fluoresceina y/o CTP, o trifosfatos de deoxinucleótido etiquetados (dNTPs). Los métodos para etiquetar sondas se describen por ejemplo en Sambrook et al . (Molecular Cloning , A laboratory Manual , tercera edición ; capítulo 8 y en particular página 9.3. ).
De preferencia, el nucleótido etiquetado de acuerdo con la presente invención es Clorodeoxiuridina (Cid U), Bromodeoxiuridina (BrdU) y/o Yododeoxiuridina (IdU).
La etiqueta de las sondas puede ser ya sea "directa", es decir, unida directamente a o incorporada a la sonda antes del paso de hibridación o "indirecta", es decir, se unen al dúplex de híbrido después de hibridación . La etiqueta indirecta se une de preferencia como una porción de aglutinación que se ha unido a la sonda antes de la hibridación. Por ejemplo la sonda puede ser biotinilada antes de la hibridación. Después de la hibridación, un fluoróforo conjugado con avidina unirá la biotina que lleva dúplex de híbrido que proporcionan una etiqueta que se detecta fácilmente.
En una modalidad particular de la invención , todas las sondas se etiquetan con la(s) misma(s) etiqueta(s).
Alternativamente, en otra modalidad particular de la invención, por lo menos una sonda se etiqueta con una o varias etiquetas diferentes de la(s) etiqueta(s) de otras sondas. Por ejemplo, las sondas pueden ser etiquetadas con dos etiquetas diferentes, en particular con dos fluorocromos diferentes, por ejemplo un fluorocromo que emite el espectro de verde/amarillo (tal como FITC) y un fluorocromo que emite en el espectro de rojo (tal como A594). En una modalidad particular adicional , por lo menos una sonda repetida o todas las sondas repetidas se etiquetan con una o varias etiquetas diferentes de la(s) etiqueta(s) de las sondas de localización .
En un aspecto más, la presente invención se refiere a un método para analizar arreglos repetidos en tándem D4Z4 in vitro de ácido nucleico contenido en ácido nucleico representativo de cromosomas (en particular para determinar in vitro el número de unidades repetidas D4z4 en dichos arreglos repetidos en tándem de D4Z4) y para localizar dichos arreglos repetidos en un cromosoma particular, dicho método que comprende realizar el método descrito en la presente, en el cual el paso c) incluye además determinar, para cada arreglo repetido de D4Z4 detectado, - si dicho arreglo repetido está ubicado en un cromosoma del haplotipo qA y en particular en un cromosoma 4, y - opcionalmente si dicho arreglo repetido está ubicado en un cromosoma del haplotipo qB; y - opcionalmente si dicho arreglo repetido está ubicado en un cromosoma 1 0; y - opcionalmente si dicho arreglo repetido está ubicado en un cromosoma Y.
Así, usando un método de la invención, se puede evaluar, para cada arreglo repetido de D4Z4 detectado, si dicho arreglo repetido está ubicado en un cromosoma 4qA y opcionalmente, si dicho arreglo repetido está ubicado en un cromosoma 4qB (en particular en un cromosoma 1 0qA o si hay alguno, 1 0q B ) y/o u n cromosoma Y .
Otro aspecto de la presente invención se refiere a u n método para la diagnosis in vitro de FSH D y/o para detectar ¡ n vitro la susceptibilidad al FSH D en un paciente. Dicho método comprende o consiste en analizar mediante un método de la i nvención , como se descri be en la presente , arreglos repetidos en tándem D4Z4 de ácido nucleico contenido en ácido nucleico representativo de cromosomas , en particular arreglos repetidos en tándem D4Z4 contenidos en una muestra de ADN genómico obtenida de dicho paciente . Dicho método puede comprender o consistir en particular en la determi nación in vitro del número de unidades repetidas D4Z4 en el arreglo repetido de D4Z4 de cada alelo 4qA detectado en la muestra de ADN genómico obtenida de dicho paciente .
En una modalidad particular, dicho método comprende o consiste en determinar (i ) el número de alelos 4qA en ADN genómico obtenido de dicho paciente y (ii ) el número de unidades repetidas D4Z4 en el arreglo repetido de D4Z4 de cada uno de estos alelos .
En una modalidad particular de la invención , un número de unidades repetidas D4Z4 debajo o igual a 1 2 y en particular d ebajo o igual a 1 1 , 1 0 , 9, 8, 7, 6 , 5 o 4 para uno o ambos alelos 4qA de un paciente es indicativo de que este paciente es susceptible a FSH D .
En otro aspecto , la presente i nvención se refiere a un paquete caracterizado porque comprende o consiste de por lo menos: - una sonda repetida o conjunto de sondas repetidas; - una sonda o uno o varios conjuntos de sondas que permite distingui r un cromosoma 4 de un cromosoma 1 0 ; y - u na sonda o uno o varios conjuntos de sondas que permite disti ngui r en haploti po qA del haplotipo qB , y - opcionalmente, una sonda o uno o varios conjuntos de sondas que permite d istinguir el cromosoma Y del cromosoma 4 y/o del cromosoma 1 0, dichas sondas que son como se definen en la presente y que están etiq uetadas o que se intenta etiquetar.
En una modalidad particular de la invención , el paquete de la invención puede comprender o consistir además de u no o varios elementos seleccionados de : - un soporte apropiado para esti rar el ácido n ucleico , en particular apropiado para peinado molecular; - un dispositivo que permite esti rar el ácido n ucleico, en particular apropiado para peinado molecular del ácido nucleico; - uno o varios reactivos para la hi bridación y/o la detección de las sondas ; - muestras de control , por ejemplo m uestras de ácido n ucleico, que fueron evaluadas previamente para el nú mero repetido usando métodos convencionales; - instrucciones para llevar a cabo un método de la invención usando d icho paquete; y - un software que permite llevar a cabo los métodos de la invención de manera más fácil .
En un aspecto más, la presente invención se refiere también a una composición que comprende o que consiste de por lo menos las siguientes sondas en solución : una o varias sondas repetidas, una sonda o uno o varios conjuntos de sondas que permite distinguir el cromosoma 4 del cromosoma 1 0, una sonda o uno o varios conjuntos de sondas que permite distinguir el haplotipo qA del haplotipo qB, y opcionalmente, una sonda o uno o varios conjuntos de sondas que permite distinguir el cromosoma Y del cromosoma 4 y/o del cromosoma 1 0, dichas sondas que están etiquetadas de preferencia y que son como se definen en la presente. Además, dicha composición puede comprender además cualquiera de las otras sondas o conjunto de sondas como se definen en la presente, y/o anticuerpos como se definen en la presente.
Otro aspecto de la presente invención, se refiere al paquete de la invención o la composición de la invención o para la diagnosis de FSH D y/o para detectar la susceptibilidad a FSH D en un paciente. Dicho paquete de diagnostico y dicha composición se pueden usar como se describe en la presente.
Otro aspecto de la presente invención se refiere al uso del paquete de la invención o de la composición de la invención, para analizar arreglos repetidos en tándem D4Z4 in vitro de ácido nucleico contenido en ácido nucleico representativo de cromosomas y en particular para determinar el número de unidades repetidas D4Z4 en arreglos repetidos de D4Z4 de ácido nucleico. Este análisis puede realizarse en particular usando un método de la invención.
En otro aspecto, la invención se refiere al uso del método para analizar arreglos repetidos en tándem D4Z4 de acuerdo con la invención, del paquete de la invención o la composición de la invención , para investigación cl ínica y/o diagnosis, en particular para diagnosis neonatal, prenatal y/o pre-implantación y/o para orientación genética.
Otro aspecto de la presente invención se refiere a un método para identificar eventos bioquímicos y/o parámetros genéticos o epigenéticos involucrados en el fenotipo de FSHD. Dicho método comprende o consiste de analizar, mediante un método de la invención , la organización de arreglos repetidos de D4Z4 contenidos en ácido nucleico representativo de cromosomas obtenido de varios pacientes (por ejemplo por lo menos 5, 1 0, 20, 30, 50 o 1 00 pacientes), en particular la organización de arreglos repetidos de D4Z4 contenidos en ácido nucleico de cromosomas 4, y opcionalmente 1 0 y/o Y, dicho análisis que se realiza independientemente para cada paciente. Dicho método puede comprender o consistir en particular en la determinación del número de unidades repetidas D4Z4 en el arreglo repetido D4Z4 contenido en dicho ácido nucleico y/o la determinación de la orientación de las unidades repetidas D4Z4 en dichos arreglos repetidos de D4Z4, y/o la detección y análisis de rearreglos en dichos arreglos repetidos de D4Z4 o en regiones cercanas a dichos arreglos repetidos de D4Z4 y/o análisis de la metilación , en particular metilación CpG, y/o el análisis de eventos bioquímicos, en particular cinética de replicación de ADN en particular, como se describe en la presente. En una modalidad particular, dicho método comprende además comparar la información obtenida de cada paciente e identificar así los eventos bioqu ímicos novedosos y/o los parámetros genéticos y epigenéticos involucrados en el genotipo de FSH D.
Finalmente, la presente invención se refiere al uso de una tecnología de peinado molecular para analizar arreglos repetidos en tándem D4Z4 in vitro de ácido nucleico contenido en ácido nucleico representativo de cromosomas, en particular para determinar in vitro el número de unidades repetidas de D4Z4 en dichos arreglos repetidos en tándem D4Z4, como se describe en la presente.
La invención será descrita adicionalmente en los siguientes ejemplos, los cuales no limitan el alcance de la invención descrito en las reivindicaciones.
Breve Descri pción de las Fig u ras Figura 1 . Ejemplo de D4Z4, sondas 4q, 1 0q, qA y qB que pueden usarse de acuerdo con la invención. Se muestran los tres patrones de hibridación esperados en el cromosoma 4q (haplotipos qA y qB) y cromosoma 1 0q (la región telomérica que es idéntica al cromosoma 4qA). Las sondas de localización que forman una firma específica para los cromosomas 4q/10q o para los haplotipos qA/qB están revelados en rojo (etiquetado con digoxigenina, cuadros blancos) y la sonda que es específica para D4Z4 está revelada en verde (etiquetado con biotina , cuadros negros). Los tamaños (redondeados al kb más cercano) de las sondas de localización y los espacios entre dos sondas de localización consecutivas están indicados respectivamente abajo y arriba de cada diagrama.
Figura 2. Señales de hibridación observadas en la muestra del paciente 1 . Para propósitos de reproducción se aumentaron los contrastes, se modificaron los colores (el fondo negro normalmente de las imágenes de microscopio es gris, las señales verdes se muestran en negro y las señales rojas en blanco), y la escala vertical se estiró dos veces (la relación de aspecto no es conservada entonces, pero las longitudes permanecen sin cambio con relación a la escala de referencia presentada). Paneles A-D: las sondas de ubicación (4q 1 , 4q2, 4q3, 4q4, 10q 1 , 1 0q2, 10q3, 10q4, qA1 , qA2 y qB 1 , como se describe en los procedimientos experimentales) se etiquetaron con digoxigenina y se revelaron en verde. La sonda de repetición se etiquetó con biotina y se reveló en rojo. Las señales observadas se muestran aqu í, con una señal representativa de cada alelo (A: alelo 4qA; B: alelo 10q corto; C: alelo 1 0q largo; D: alelo 4qB). Debido a una eficiencia de hibridación menor que 1 00% , algunas de las señales parecen más cortas de lo que deben ser. Este es particularmente el caso con la segunda sonda (contando desde el centrómero, es decir, la sonda 4q2) en el panel A. Panel E: en una hibridación separada, la sonda beta-satélite estuvo presente también. Se muestra una señal representativa del alelo 4qA. Se detecta adyacente al arreglo repetido una señal que corresponde a la sonda beta-satélite. La confusión con la sonda qB se puede ver comparando la señal obtenida para 4qB (panel D). Se debe notar que en la señal del panel E, la sonda qA2 no se detecta, probablemente debido a una ruptura en la molécula o por hibridación ineficiente.
Figura 3. Histograma de las medidas de D4Z4. Histograma que muestra el número de arreglos repetidos D4Z4 intactos en un intervalo de longitud dada que estaban contenidos en ADN genómico aislado de la muestra del "Paciente 1 " . El ancho del intervalo es de 3.3 kb, la primera barra representa el número de medidas dentro del intervalo [0/3.3 kb]. Así, por ejemplo, la quinta barra representa el número de medidas en el intervalo [1 3.2 kb-1 6.5 kb]. Panel A: se registró la longitud de cada arreglo repetido D4Z4 detectado (1 1 4 medidas). En este histograma aparecen cuatro modos diferentes (cada uno de estos modos que está señalado mediante una flecha). Panel B: se registró la longitud de cada arreglo repetido D4Z4 intacto asociado con señales de hibridación 4q (61 medidas). En este histograma aparecen dos modos diferentes (cada uno de estos modos está señalado mediante una flecha). Panel C: se registró la longitud de cada arreglo repetido D4Z4 intacto asociado con señales de hibridación 1 0q (43 medidas). En este histograma aparecen dos modos diferentes (cada uno de estos modos está señalado mediante una flecha). Panel D: se registró la longitud de cada arreglo repetido D4Z4 intacto asociado con señales de hibridación qA (32 medidas). En este histograma aparecen tres modos diferentes (cada uno de estos modos está señalado mediante una flecha). Panel E: se registró la longitud de cada arreglo repetido D4Z4 intacto asociado con señales de hibridación qB (23 medidas). En este histograma aparece un modo (señalado mediante una flecha).
Figura 4. Esquema que muestra la organización de diferentes regiones que son teloméricas con el arreglo repetido D4Z4 en el brazo largo de los cromosomas del haplotipo qA (en particular cromosomas 4qA y 1 0qA) y en , el brazo largo de los cromosomas del haplotipo qB (en particular el cromosoma 4qB). Para el haplotipo qA se seleccionaron arbitrariamente la longitud del arreglo repetido beta-satélite y el arreglo repetido TTAGGGn, puesto que estas longitudes son altamente variables. B-D. Ejemplos de conjuntos de sondas que pueden usarse para distinguir el haplotipo qA del haplotipo qB. En el panel B , están indicadas dos opciones para la única sonda qB . En el panel C se muestra cómo se pueden obtener tres señales de ~1 kb con dos sondas en qB.
Figura 5. (a y b). A. Esquema que muestra la organización de las diferentes regiones que son centroméricas al arreglo repetido D4Z4 en los cromosomas 4q y 1 0q. B-D. Ejemplos de conjuntos de sondas que pueden usarse para distinguir el cromosoma 4 del cromosoma 10.
Figura 6. (a y b). Uso de dos sondas repetidas diferentes para determinar la orientación de las unidades repetidas D4Z4 en un arreglo repetido de D4Z4. Las dos sondas repetidas usadas hibridan con aproximadamente una mitad de la unidad repetida D4Z4 (Dee y Zee hibridan respectivamente con la mitad centromérica y la mitad telomérica de la unidad repetida D4Z4). Además, traslapan ligeramente sobre 1 00 bp y están etiquetadas con una etiqueta diferente. Panel A muestra una organización hipotética del arreglo repetido, con una repetición invertida (la tercera que comienza desde el centrómero). Panel C muestra los patrones de hibridación esperados para ambas sondas, usadas una a la vez. Panel D muestra el patrón de hibridación esperado para ambas sondas usadas conjuntamente con etiquetas diferentes.
Figura 7. Uso de un enfoque combinatorio para determinar la naturaleza de una secuencia i nsertada. En el panel A se muestra la representación esquemática de señales de hibridación detectadas en un caso hipotético. Las 6 sondas numeradas, detectadas en rojo (cuadros blancos no circulados), están en su ubicación esperada , así como también la sonda repetida detectada en verde (cuad ro negro). La presencia de una señal de hi bridación inesperada (circulada ) es indicativa de la inserción de secuencias en el espacio entre la señal de hi bridación q ue corresponde a la sonda nú mero 4 y la señal de hi bridación que corresponde a la sonda repetida, estas secuencias insertadas que se presentan en una de las sondas rojas. Con el fin de evaluar cual sonda híbrida en esta ubicación , se puede real izar el mismo experimento de hibridación mientras que se omite una o varias sondas seleccionadas entre las sondas 1 a 6. En el panel B hay un esquema óptimo de sondas para identificar la sonda dupl icada : en los tres experimentos descritos, se deben i ncl uir las sondas con una X , omitir aquellas con un guión .
Dependiendo de cuándo aparece o no la señal i nesperada , se puede identificar únicamente la sonda duplicada . Por ejemplo , si los resultados de los experimentos son como se representan en el panel C, las secuencias insertadas se originaron a parti r de la sonda número 4 (panel D). El tamaño de la señal i nesperada es indicativo de la porción de la sonda que se duplicó.
Ejem plos 1 . Diseño de las Sondas Diseñamos conjuntos de sondas para medir los arreglos repetidos D4Z4, evaluar su ubicación en los cromosomas 4q o 1 0q y distinguir los dos haplotipos 4q (qA y qB) (ver Figura 1 ) y métodos para analizar la información generada.
La sonda diseñada para medir el arreglo repetido es la secuencia total (3.3 kb) de una repetición D4Z4 sencilla.
Las sondas diseñadas para distinguir arreglos en cromosomas 4q versus 10q están ubicadas en forma centromérica al arreglo repetido, aproximadamente 50 kb corriente arriba, es decir, tan cerca como sea posible en la región que es distinta entre 4q y 1 0q . Un conjunto de sondas híbrida en 4q como cuatro señales separadas por espacios de 1 0 kb, la sonda más cercana que está a -65 kb corriente arriba del arreglo repetido. Las tres sondas más cercanas al arreglo repetido generan una señal de 10 kb, la más distante una señal de 7.5 kb. El otro conjunto híbrida en 10q como cinco señales de 5 kb separadas por espacios de 5 kb, la sonda más cercana que está a -45 kb corriente arriba del arreglo repetido.
Las sondas diseñadas para distinguir los haplotipos qA y qB están ubicadas en las secuencias cortas únicas para cualquier haplotipo, a saber una secuencia de 5 kb específica para qB inmediatamente corriente abajo del arreglo repetido y dos secuencias específicas para qA, de 801 bp y 1 950 bp de largo, ubicadas respectivamente a aproximadamente 2.5 kb y 8.5 kb corriente abajo del extremo telomérico del arreglo repetido beta-satélite en el brazo largo del cromosoma 4qA, lo que significa ubicado aproximadamente - la longitud de un arreglo repetido D4Z4 que es variable - 8 kb y 1 3.5 kb respectivamente corriente abajo del extremo telomérico del arreglo repetido D4Z4.
Una selección que gobierna este diseño de sondas fue mantener un código completamente interpretable con solamente dos fluorocromos, con el fin de permitir la adquisición rápida y simple de imágenes. Puesto que la longitud del arreglo repetido es muy variable, el fluorocromo asociado con la sonda repetida es su única característica constante. Con el fin de incluir todas las mediciones posibles de los arreglos en el análisis (discutido más adelante), es necesario reconocer sin ambigüedad la sonda repetida independientemente de su contexto. Por lo tanto, un fluorocromo específico estuvo dedicado para esta sonda, dejando solamente otro fluorocromo para todas las otras sondas. Así, las sondas de ubicación (las sondas diseñadas para distinguir el cromosoma 4 del cromosoma 10 y el haplotipo q4 del haplotípo qB) se hicieron distinguibles por su longitud , separación y posición con relación al arreglo. Las diferencias redundantes permiten gran robustez con relación a variantes de secuencias (por ejemplo, eliminación de secuencias corriente arriba del arreglo repetido), y para rupturas en las moléculas de ADN durante el proceso de Peinado Molecular que puede ocurrir en el motivo.
Con el fin de ensayar FSHD, este conjunto completo de sondas se híbrida en ADN genómico peinado, la sonda D4Z4 que se detecta con un color, usualmente verde (fluorocromos: FITC y A488) y las sondas de ubicación fluorocromos: A594 y Texas Red). Para el análisis, se incluyen todas las señales que contienen por lo menos un segmento verde. Se midieron todos los segmentos en una señal , y donde la sucesión de sondas permite la distinción ambigua, la señal se clasificó manualmente como 4q o 10q y/o qA o qB . 2. Análisis de la i nformación generada El método más directo para evaluar el tamaño de los arreglos repetidos sería graficar el histograma de las longitudes de sondas verdes para las señales seleccionadas, es decir, aquéllas que han sido completamente caracterizadas (cromosoma y haplotipo). En un histograma de señales 4qA se esperan, por ejemplo , cero, uno o dos picos para un homocigoto 4qB/4qB, heterocigoto 4qA/4qB u homocigoto 4qA/4qA individuales respectivamente. En el caso de un mosaico, aparecería un pico suplementario. El tamaño de los arreglos en cromosomas 4qA se determina midiendo la media de las longitudes de los segmentos verdes en el/los pico(s) detectado(s) del histograma. El número de las unidades repetidas se puede deducir de la longitud y la longitud/proporción (tamaño de una repetición).
Sin embargo, dada la significativa probabilidad de que ocurra una ruptura en el motivo de sondas y/o que una sonda no se detecte (especialmente las sondas cortas), excluyendo todas las señales incompletas o ambiguas de las mediciones se reduce considerablemente el número de segmentos repetidos realmente considerados para el cálculo de la media, reduciendo así la precisión de este cálculo. Por lo tanto, decidimos graficar un histograma de todas las mediciones de arreglos repetidos, local izados o no (información no clasificada, ver un ejemplo en la Figura 3, panel A). Aparecen varios picos, que corresponden a los dos cromosomas 4q , los dos cromosomas 1 0q y , en los individuos machos , el cromosoma Y (donde se ubica un arreglo repetido con una secuencia altamente similar, el ejemplo representado en la Figura 3 es de un individuo hembra ). Los picos se caracterizan graficando por separado los histogramas de arreglos ubicados en 4q , 1 0q , qA o qB (histogramas de ubicación específica , ver Fig ura 3, paneles B-E ).
Siempre que haya suficiente diferencia de tamaño entre arreglos repetidos para distinguir los picos en la i nformación no clasificada , la longitud media se mide en cada pico en este conjunto entero . Esto maximiza el número de determi naciones de la longitud para cada pico . Si n embargo, en un caso cuando dos arreglos ubicados de manera distinta (como se muestra en histogramas de ubicación específica) tienen longitudes similares, la longitud de cada arreglo debe determi narse usando solamente las med iciones de arreglos cuya ubicación podría ser discri mi nada . En el ejemplo representado en la Figura 3 , los dos picos más cortos y los dos más largos se traslapan ( Figura 3, panel A). Por lo tanto , se midieron longitudes promedio de los conjuntos de datos específicos de 4q y específicos de 1 0q , en los que los dos picos de cada cromosoma son claramente distinguibles (Figura 3 , paneles B y C).
Un i mportante parámetro sintonizable de las pruebas es el número de señales usadas en el análisis. De hecho , este número puede ser virtualmente creciente de manera ilimitada mediante el incremento del número de portaobjetos usado. Si después del primer análisis, se considera que el número de señales es insuficiente por alguna razón , es sencillo hibridar y analizar portaobjetos adicionales. Algunas razones posibles para esto son la voluntad de aumentar la precisión de la medición o tener en cuenta un mosaicismo posible.
De hecho, la precisión del cálculo de la media está vinculado al número de señales usado en este cálculo (más específicamente, es proporcional a 1 /((n) raíz cuadrada) donde n es el número de señales). El error máximo en el número de unidades repetidas es el entero inmediatamente arriba de la proporción (error máximo en tamaño de medio)/(tamaño de una repetición). En algunos casos, se puede tolerar una incertidumbre en el número de unidades repetidas. Sin embargo, en otros casos, por ejemplo cuando se ha detectado un arreglo con un número de repetición en l ínea de frontera, especialmente en un cromosoma 4qA) puede ser necesario para determinar confiablemente el número exacto de unidades repetidas. En este caso, la adquisición y análisis de señales puede repetirse hasta que el número de señales sea suficiente para que el error máximo en la media calculada sea menor que el tamaño de una repetición.
Aumentar el número de señales puede ser necesario también cuando se sospecha un caso de mosaicismo. Las indicaciones para la existencia de un mosaico pueden darse por información ya sea clínica o familiar, o por uno de los histogramas, ya sea información no clasificada o de ubicación específica. En el último caso, las indicaciones incluyen un número esperado de picos. 3. Procedimientos Experimentales 3.1 Preparación y Peinado Molecular de ADN Se obtuvieron líneas de células linfoblastoides humanas GM 1 7724 y GM 1 7939 de Coriell Cell Repository (http://ccr.coriell .org) y cultivadas de acuerdo con instrucciones del proveedor. Se recolectaron muestras de sangre humana normal y FSHD en el hospital La Timone - enfants ((Asistencia Pública/Hospital de Marseille). Se obtuvo el consentimiento escrito de los pacientes para participar en este estudio. Se purificaron células de sangre monocíticas periféricas usando procedimientos normales, mediante lisis de células rojas de sangre.
Se extrajo ADN mediante el procedimiento normal descrito en Lebofsky y Bensimon, 2006. Brevemente, las células se resuspendieron en PBS a una concentración de 107 células/mL. La suspensión de células se mezcló perfectamente en una proporción de 1 : 1 con una solución al 1 % w/v de agarosa de bajo punto de fusión (Nusieve GTG, ref. 50081 , Cambrex) preparada en PBS, a 50°C. Se vertieron 1 00 pL de la mezcla de células/agarosa en un pozo de formación de tapón (BioRad , ref. 1 70-371 3) y se dejó enfriar durante por lo menos 30 min a 4°C. Los tapones de agarosa se incubaron durante una noche a 50°C en 250 pL de una solución de EDTA 0.5 M (pH 8), 1 % Sarkosyl , 250 pg/mL proteinasa K (Eurobio, código: GEXPRK01 ), después se lavaron dos veces en una solución de Tris 1 0 mM, EDTA 1 mM durante 30 min a temperatura ambiente. Los tapones se fundieron entonces a 68°C en una solución de M ES 0.5 M (pH 6) durante 20 min , y se agregaron 2 unidades de beta-agarasa (New England Biolabs, ref. M0392S) y se dejaron incubar durante una noche a 42°C. Después se vertió la solución de ADN en un recipiente de Teflón y se realizó el Peinado Molecular usando el Sistema de Peinado Molecular (Genomic Vision S.A. , Paris, France) y tapas de cubierta de Molecular Combing (20 mm x 20 mm , Genomic Vision S.A. , París, France). Las superficies peinadas se secaron durante 6 horas a 60°C. 3.2 Hibridación, Detección y Análisis Se realizaron también pasos subsecuentes esencialmente como se describió previamente en Lebofsky y Bensimon , 2006. Brevemente, se precipitó en etanol una mezcla de sondas etiquetadas (250 ng de cada sonda, ver más adelante para detalles con respecto a la síntesis y etiquetación de sondas) junto con 10 pg de ADN de esperma de arenque y 2.5 pg de ADN CoM Humano ( Invitrogen , ref. 1 5279-01 1 ), resuspendido en 20 µ!_ de búfer de hibridación (50% formamida, 2X SSC, SDS al 0.5% , Sarcosyl al 0.5% , NaCI 1 0 mM, 30% Block-aid ( I nvitrogen, ref. B-1 0710)). La solución de sondas y las sondas se desnaturalizaron por calor conjuntamente en el Hybridizer (Dako, ref. S2451 ) a 90°C durante 5 min y se dejó avanzar la hibridación en el Hybridizer durante una noche a 37°C. Los portaobjetos se lavaron 3 veces en formamida al 50%, 2x SSC y 3 veces en soluciones de 2x SSC, durante 5 min a temperatura ambiente. En las Tablas 1 y 2 se describen capas de detección de anticuerpos. Los anticuerpos se diluyeron en Block-Aid como se indica en la Tabla . Por cada capa, se agregaron 20 µ ?_ de la solución de anticuerpos en el portaobjetos y se cubrió con una tapa de cubierta y el portaobjetos se incu bó en atmósfera húmeda a 37° C durante 20 min . Los portaobjetos se lavaron 3 veces en una solución de 2x SSC , Tween20 1 % du rante 3 min a temperatura ambiente entre cada capa y después la últi ma capa. El portaobjetos se secó en soluciones de etanol sucesivas de 70% , 90% y 1 00% antes de montar con Vectashield (Abcys , código: H- 1 000). Los portaobjetos se observaron entonces usando microscopios de epifluorescencia convencionales, todas las señales de interés se digitalizaron usando una cámara CCD (CoolSNAP HQ , Roper Scientific), y se realizaron man ualmente med iciones de distancias usando software I mageJ [http://rsbweb . nih.gov/ij/] o JMeasure (Genomic Vision S . A. , Paris, France). El tipo de sitio (cromosoma y haploti po) se eval uó manualmente mediante comparación del motivo observado con los motivos predichos y toda la información (mediciones y evaluación manual del tipo de sitio) se registró en un archivo M icrosoft Excel® para análisis posterior. El anál isis se describe en detalle en otra parte de este documento.
Tabla 1 . Lista de anticuerpos v otras moléculas de hapteno de unión usados para la detección de sondas Descripción Abreviación Proveedor Estreptavidina, acoplada a Estrep/A488 Invitrogen Alexa Fluor 488 Anti-estreptavidina de Anti-estrep Rb/biotina Rockland conejo acoplada a biotina Estreptavidina acoplada a Estrep/A594 Invitrogen Alexa Fluor 594 Anti-dig de ratón acoplado Anti-DIG M/TR Jackson Immuno a Texas Red Research Anti-ratón de cabra Anti-M G/A594 Invitrogen acoplado a A594 Anti-A488 de conejo Anti Rb-A488 Invitrogen Anti-DIG de ratón Anti-DIG M/AMCA Jackson Immuno acoplado a AMCA Research Anti-DIG de rata acoplado Anti-M Rt/AMCA Jackson Immuno a AMCA Research Anti-rata de cabra Anti-Rt G/A350 Jackson Immuno acoplado a A350 Research Anti-conejo de cabra Anti-Rb G/A488 Invitrogen acoplado a A488 Anti-estreptavidina de Anti-estrep G/biotina Jackson Immuno cabra acoplado a biotina Research 3.3 Síntesis y Etiq uetado de Sondas Las coordenadas de todas las sondas (con relación a la secuencia de referencia NCBI construcción 36.1 Humana cuando sea posible, o a una secuencia Genbank) se enlistan en la Tabla 3.
Las sondas Dee y Zee, que contienen , cada una , la mitad de la secuencia repetida D4Z4 (ver descripción) se obtuvieron mediante síntesis de novo y se insertaron en plásmido pJ56 (ADN2.0 Inc. , Menlo Park, CA, EUA). Se introdujeron mutaciones de dos puntos relacionadas con la secuencia de referencia en el traslape de las dos sondas (G>A y C>G en posiciones 1 659 y 1 582 de la sonda Dee y en las posiciones correspondientes en la sonda Zee) con el fin de permitir la reconstitución de la secuencia repetida completa mediante la introducción de sitios únicos EcoRI y Not1 . La secuencia repetida completa ("sonda repetida") se obtuvo por escisión de la secuencia Zee a partir de su plásmido y ligación en el plásmido que lleva Dee. Dado el alto contenido de GV, las sondas Dee, Zee y repetida se etiquetaron solamente con dCTP modificado (cDTP-biotina y/o cDTP-A488).
Tabla 2. Composición de las 3 capas para la detección de sondas por fluorescencia. La dilución para cada agente de detección está indicada entre corchetes. Las abreviaciones se refieren a la Tabla 1 .
Se produjeron sondas específicas de cromosomas 4q y 10q mediante PCR de largo alcance usando polimerasa de ADN LR Taq (Roche, paquete código: 1 1 681842001 ) usando los cebos enlistados en la Tabla 4 y los fósmidos enlistados en Tabla 3 como ADN plantilla. Se ligaron productos PCR, cada uno de aproximadamente 2.5 kb de largo, en el plásmido pNEB 1 93 (New England Biolabs I nc. , Beverly, A, EUA). De determinaron secuencias de las dos extremidades de cada sonda para propósito de verificación. Las sondas aparentes de 5 kb (1 0q 1 -4), 7.5 kb (4q1 ) y 1 0 kb (54q2-4) son mezclas de dos, tres o cuatro sondas adyacentes de 2.5 kb.
La sonda beta-satélite es un plásmido que contiene diez repeticiones de la secuencia satélite de 68 bp.
Tabla 3. Coordenadas de las sondas diseñadas. La referencia para las coordenadas está indicada arriba de las sondas correspondientes. Para los cromosomas 4 y 1 0. las coordenadas se refieren a la construcción 36.1 de la secuencia de referencia NCBI Humana . Para las sondas donde esto no fue posible (las regiones qA no pertenecen a la secuencia de referencia) o podrían ser ambiguas, el número de acceso de Genbank para la secuencia de referencia está indicado. qB1-3 191252023 191253372 qB1-4 191248879 191252040 Ref. U74496.1 Sonda Comienzo Final qA1 2756 3556 qA2 8723 10672 Ref. U85056.1 Sonda Comienzo Final Deezee 24213 27507 Dee 24213 25948 Zee 25763 27507 Ref. Chr.10 Sonda Comienzo Final 10q1 135247926 135252909 10q2 135257958 135262966 10q3 135267992 135272976 10q4 135278058 135282988 Se produjeron las sondas qA- y qB-específicas mediante PCR de largo alcance usando los cebos enlistados en la Tabla 4 y ADN extraído por métodos convencionales de una muestra de sangre de un paciente recolectada en el hospital La Timone como ADN de plantilla. Se ligaron productos PCR en el plásmido pNEB193 (New England Biolabs Inc., Beverly, MA, USA). Las dos extremidades de cada sonda fueron secuenciadas para propósito de verificación. Las sondas qB1-3 y qB1-4 de qB son adyacentes e hibridan como una sonda 5-kb sencilla debido a repeticiones internas en la secuencia.
En experimentos de control , donde las sondas se identificaron de manera diferente, no se observó hibridación cruzada significativa de sondas 4q con sondas 10q o de sondas qA con sondas qB .
Tabla 4. Secuencias de cebo usadas para la síntesis de sondas med iante PCR de largo alcance. Los cebos contienen sitios de restricción en 5' de la secuencia a ser amplificada para propósito de clonación . Los prod uctos de PCR hibridan de manera adyacente v que constituyen así la misma sonda están agrupados v nombrados de manera idéntica excepto para el número que sig ue del guión . Para fósmidos usados como ADN plantil la, se indica el nombre de referencia del fósmido en la base de datos U CSC Human Genome Browser (http://qenome. ucsc .edu ).
Sonda PCR Cebo adelante Cebo inverso ADN plantilla qA1 qA1 CCTTTGTCGCTTCAAACACC CATTCCGAGACAGAAAGAGGA ADN de paciente qA2 qA2 CGTTGATGTCTCCACCTCTG TCACACAAAGCTATAAGGACTGC ADN de paciente qB1 qB1-3 AGTTCCCCAACGGGACAG GGCAAGGACTTCATGCCTAA ADN de paciente qB1-4 CGCCTGTAATTCCTGCATTT CTGGGTGGACTCTGCTGTG ADN de paciente 4q1-1 CCCCACAATATCACCCCTTA AGGTCTAGCATGGGGCATAG G248P85948G12 4q1 4q1-2 GCCCCATGCTAGACCTACTG TGAGAGTGATTTCAGCTTGACAG G248P85948G12 4q1-3 TGTCAAGCTGAAATCACTCTCAA TGTGTATTCCCAGGCCTCTC G248P85948G12 4q2-1 GGAGTGCAGTGACATGATCG TGCTGGGATTACAGGTGTGAG G248P85948G12 4q2 4q2-2 CTGTAATCCCAGCACTTTGG CCAGAATTGACTTTTACTCCTTTATAC G248P85948G12 4q2-3 GGAGTAAAAGTCAATTCTGGCATC ATCAAGGTGCATAACACATGGA G248P85948G12 4q2-4 TCCATGTGTTATGCACCTTGAT CACTGGTGCAATGGATAACG G248P85948G12 4q3-1 GTGGTTTCGGTTCCCAACTA Al I I I U I G I GUCAACCC I GI G248P800659G7 4q3 4q3-2 ACAGGGTTCCCACAGAAAAT TTTGTGGACTGTGGTTTGTTAGA G248P800659G7 4q3-3 TCTAACAAACCACAGTCCACAAA TGTGGCATCCAGTATATTCAGTG G248P800659G7 4q3-4 CACTGAATATACTGGATGCCACA GTGCCCATGTATTTCCCAAT G248P800659G7 4q4-1 TCCCACCAACAGTGTAAAAGC T'IT I CI 1 AGCTGGGGCTGAA G248P800659G7 4q4 4q4-2 TTCAGCCCCAGCTAAGAAAA TCCTGAGCCATAGCTCTCAGT G248P800659G7 4q4-3 ACTGAGAGCTATGGCTCAGGA AGTGCCCCATAAGCACAGAC G248P800659G7 4q4-4 GTCTGTGCTTATGGGGCACT GGATCAGGCCCAGGATCT G248P800659G7 10q1 10q1-1 CCAAAGACAAAAACCACATGAT TAAATTCCAGACAGCGCAGA G248P81988E3 10q1-2 GTCTGCGCTGTCTGGAATTT GGTGGTCATAGTGGGGGATT G248P81988E3 10q2 10q2-1 TTGCCTAATCCATGGTCACA GAAGACCTGACCAACACAATCA G248P81988E3 10q2-2 TGATTGTGTTGGTCAGGTTCTTC AAAAGAAAACCGTCTAAGAGAGAGG G248P81988E3 10q3 10q3-1 TAAGGCTTGTGATGCATTGG GGAAGGCAATATCCATGATGTTA G248P81988E3 10q3-2 TAACATCATGGATATTGCCTTCC ACCCTTTGGCACAGAGCTT G248P81988E3 10q4 10q4-1 CATCTTCATCAGAGAAAGCCAAG TGGGCTAGGCCCAAAGTA G248P81988E3 10q4-2 ACAGGCTCAGCTAAGGTTTTCAC AGATGCAAACGGCTGTGAG G248P81988E3 La etiquetación de las sondas se realizó usando protocolos aleatorios convencionales. Para etiquetado de dCTP-biotina, se usó el paquete Random Priming (I nvitrogen , código: 1 8094-01 1 ) de acuerdo con las instrucciones del fabricante, excepto que la reacción de etiquetación se dejó avanzar durante una noche. Para otras etiquetas (dUTP-digoxigenina , dUTP-A488, dCTP-A488), la mezcla de dNTP del paquete se remplazó por la mezcla especificada en la Tabla 5. Se etiquetaron 200 ng de cada plásmido en reacciones separadas. Los productos de reacción se visualizaron en un gel de agarosa para verificar la síntesis de ADN .
Tabla 5. Mezclas usadas en reemplazo de la mezcla de dNTP del paquete de cebado aleatorio para etiquetar con haptenos alternativos. Las concentraciones indicadas son la concentración final en la reacción de etiquetación. Los dNTPs no etiquetados y el dNTP etiquetado se agregaron conjuntamente en reemplazo de la mezcla de d NTP proporcionada destinada a etiquetar con dCTP-1 1 -biotina. 4. Resu ltados El conjunto de sondas usadas para realizar el método de la invención se muestra esquemáticamente en la Figura 1 . Los detalles específicos concernientes a la posición y síntesis de sondas están disponibles en la sección de procedimientos experimentales. La sonda repetida se etiquetó con biotina y se detectó en verde y las sondas de ubicación se etiquetaron con digoxigenina y se detectaron en rojo. Señales típicas obtenidas de la muestra del paciente 1 (descrito más adelante) se muestran en la Figura 2, panel A-D. La sonda beta-satélite no se usó generalmente debido a la posible confusión con la sonda qB . Sin embargo, se hicieron hibridaciones de prueba con esta sonda. Una señal típica se muestra en la Figura 2, panel E, del mismo alelo que la Figura 2 panel A.
El proceso para calcular el número de arreglos repetidos se detalla más adelante para una de las muestras analizadas. Esta muestra se tomó de una muestra de sangre de un paciente hembra de FSH D y se trató como se describe en la sección de procedimientos experimentales. El análisis reportado aquí corresponde a "enfoque relajado - señales intactas" como se describe más adelante.
Se midió la longitud de cada arreglo repetido D4Z4 intacto detectado (es decir, arreglos repetidos con sondas de ubicación detectadas en ambos lados, garantizando así que no hubo ruptura dentro del arreglo). El histograma resultante se muestra en la Figura 3, panel A. Cuatro modos, es decir, 4 máximos locales, aparecen claramente en las siguientes longitudes en este histograma: 1 4.9 kb, 28.1 kb, 70.1 kb y 87.5 kb. Estos modos corresponden aproximadamente al siguiente número de unidades repetidas D4Z4: 5, 9, 22 y 27 respectivamente.
Se establecieron histogramas similares mediante la recopilación de la longitud de cada arreglo repetido D4Z4 -detectado asociado con señales de hibridación que corresponden a las diferentes sondas de ubicación ; entre las 1 14 medidas recopiladas en el histograma de la Figura 3, panel A, las que corresponden a la señal de hibridación específica D4Z4 que estuvieron asociadas con una firma específica para el cromosoma 4q, el cromosoma 1 0q, cromosomas del haplotipo qAo cromosomas del haplotipo qB se muestran respectivamente en la Figura 3, paneles B a E.
En el histograma correspondiente a los arreglos repetidos D4Z4 ubicados en los cromosomas 4q mostrados en el panel B , aparecen claramente dos modos en las siguientes longitudes: 14.9 kb y 87.5 kb. Corresponden aproximadamente al siguiente número de unidades repetidas D4Z4: 5 y 27 respectivamente.
En el histograma correspondiente a los arreglos repetidos D4Z4 ubicados en los cromosomas 1 0q mostrados en el panel C, aparecen claramente dos modos en las siguientes longitudes: 28.1 kb y 71 .0 kb. Corresponden aproximadamente al siguiente número de unidades repetidas D4Z4: 9 y 22 respectivamente.
En un histograma que corresponde a los arreglos repetidos D4Z4 ubicados en los cromosomas del haplotipo qA mostrado en el panel D, aparecen claramente tres modos en las siguientes longitudes: 1 4.9 kb , 28.1 kb y 71 .0 kb. Corresponden aproximadamente al siguiente número de unidades repetidas D4Z4: 5, 9 y 22 respectivamente.
En el histograma que corresponde a los arreglos repetidos D4Z4 ubicados en los cromosomas del haplotipo qB mostrado en el panel E, aparece claramente un solo modo, en una longitud de 87.5 kb. Este modo corresponde aproximadamente a 27 unidades repetidas D4Z4.
Los diferentes modos identificados en cada uno de los histogramas mostrados en la Figura 3, así como también como los números correspondientes de unidades repetidas D4Z4 están recapitulados en la Tabla 6 más adelante.
Las siguientes conclusiones se pueden extraer de la Tabla 6: El ADN genómico analizado contiene: - un alelo 4qB, que lleva 27 unidades repetidas D4Z4 (el modo correspondiente está presente para las señales de hibridación tanto de 4q como de qB); - dos alelos 10q, que llevan 9 y 22 unidades repetidas D4Z4 respectivamente (los dos modos correspondientes están presentes para las señales de hibridación tanto de 10q como de qA); y - un alelo 4qA, que lleva 5 unidades repetidas D4Z4 (el modo correspondiente está presente para señales de hibridación tanto de 4q como de qA).
Tabla 6. Caracterización de los diferentes modos identificados en los histogramas de la Figura 3. Para cada modo, están indicados tanto la longitud en kb del arreglo repetido D4Z4 como el número de unidades repetidas (en corchetes).
Las aproximaciones anteriores pueden darse, sin embargo, con más certeza como intervalos. Es necesario estimar el tamaño promedio de las mediciones en un pico y la desviación estándar de las mediciones con el fin de hacerlo. Para cada pico, la desviación estándar de las mediciones se estimó como sd = 1 kb + 0.1 L donde L es la longitud del modo considerado, de acuerdo con nuestra experiencia con mediciones de peinado molecular. Virtualmente todas las mediciones (>95%) para un alelo dado deben caer dentro del int. [L-2.sd; L+2.sd]. puesto que estos intervalos no se traslapan con ninguno otro para los 2 picos más cortos ([9.9-19.8] y [21.8; 37.6] respectivamente), todas las mediciones de arreglos repetidos D4Z4 intactos dentro de uno de estos intervalos fueron considerados como pertenecientes a estos alelos, aún si su ubicación precisa no pudiera ser determinada a partir de las sondas de ubicación. El tercer y el cuarto picos, sin embargo, tienen intervalos traslapantes ([54.8-87.1] y [68.0; 106.9] respectivamente), de manera que no podría aplicarse el mismo método. Sin embargo, puesto que uno de estos picos es un alelo 4q y el otro un alelo 1 0q , todas las mediciones intactas de arreglos repetidos D4Z4 identificados como pertenecientes al cromosoma 1 0 en el intervalo [54.8-87.1 ] (que pertenece respectivamente al cromosoma 4 en el intervalo [68.0; 1 06.9]) fueron considerados como pertenecientes al alelo 1 0q largo y al 4q largo, respectivamente. Se podría haber obtenido la misma separación usando información de qA y qB, o información de haplotipo y cromosoma, con poca diferencia en el resultado. El número de mediciones que usan estos criterios y las longitudes promedio resultantes se resumen en la Tabla 7.
Tabla 7. Determinación de tamaño de alelo para los 4 alelos del paciente 1 . Se indican el tamaño promedio en kb, el número n de mediciones usadas para el cálculo del promedio, el intervalo de confianza (Cl ) del 95% para el tamaño en kb y el intervalo de confianza (>95%) para el número repetido.
El error máximo en la longitud promedio calculada de esta manera puede definirse como 2.sd/Vn, donde n es el número de mediciones consideradas. Hay un 95% de probabilidad de que las longitudes reales de arreglos repetidos caigan dentro de este intervalo. Los intervalos de confianza de 95% resultantes se resumen en la Tabla 7. El número de repeticiones es estimado mediante LV3.3, donde L es la longitud promedio calculada. El número m ínimo y máximo de arreglos repetidos se seleccionó redondeando al entero inmediatamente inferior la longitud promedio mínima/3.3 y arriba de la longitud promedio máxima, respectivamente. Dado que esto amplía el intervalo de confianza, la probabilidad de que el número de repeticiones real caiga dentro de este intervalo es mayor que 95%. Los intervalos de confianza se resumen en la Tabla 7.
Tabla 8. Resultados del método descrito v de otros métodos para muestras de sanare del paciente v líneas de células de referencia. Los haplotipos qA/qB se determinaron solamente mediante peinado molecular. Para muestras de los pacientes, un guión indica un alelo más largo que 50 kb, para el cual no se podría establecer el número de repeticiones. El signo de interrogación para el paciente 4 indica un alelo gue no podría ser detectado mediante Southern Blotting. 4qA 6-8 8 2 4qA 31-34 - 10q 10-12 12 10q 23-26 - 4qA 2-4 8 3 4q? 85-91 - 10q 17-21 12 10q 24-27 - 4qA 8-10 8 4 4qA 21-27 - 10q 6-8 12 10q 17-21 - Línea de Alelo Peinado CCR célula Molecular Repeticiones Repeticiones 4qA 7-9 6 GM17724 4qB 18-20 18 10q 17-19 16 10q 25-28 25 4qA 4-6 3 G 17939 4qB 30-34 33 10q 14-16 15 10q 25-30 26 Se realizó el mismo procedimiento para varias otras muestras: neas de células de Coriell Cell Repository (CCR): GM17724 y 939, que llevan alelos FSHD y cuatro pacientes. Los resultados se dan en la Tabla 8. Como una comparación , los resultados obtenidos a partir de otros métodos están enlistados también en la Tabla 8 (última columna). Para las líneas de células CCR, los resultados muestran la determinación del número de repeticiones para los cromosomas 4 y 1 0 publicados por CCR. Para las muestras de los pacientes, se dan los resultados de los procedimientos convencionales de southern blotting. En el último caso, no podrían separarse y no se estimaron sus tamaños de alelos más largos que 50 kb (aproximadamente 1 5 unidades repetidas).
Como es obvio de la Tabla 8, nuestros resultados están de conformidad con medidas establecidas de otra manera del número y el tipo de repeticiones D4Z4. En el caso del CCR, se debe notar que con la mayor frecuencia la evaluación mediante CCR no cae dentro de nuestro intervalo de confianza. Esto se debe probablemente a una diferencia en referencias, tal como una repetición de variante que no se contabilizó por la evaluación de CCR, pero que nosotros detectamos como una unidad repetida. En consecuencia , la desviación entre ambos de nuestros resultados está orientada siempre en la misma manera (el CCR subestima el número de repeticiones comparado con nuestros resultados). Se debe mencionar también que para la l ínea de células GM 1 7939 , la única muestra en nuestros resultados que corresponde a un individuo macho, se observó un pico suplementario alrededor de 35 kb, lo cual no se asoció nunca con las sondas de ubicación y así se supuso que corresponde a un arreglo repetido en el cromosoma Y. Este arreglo repetido no se menciona en la documentación de CCR. 5. Posibles extensiones o variaciones 5.1 Diseño de sonda de ubicación 5.1.1 Reglas generales El conjunto de sondas que diseñamos pueden reemplazarse por cualquier conjunto de sondas que permita distinguir los cromosomas 4q y 1 0q y los haplotipos 4qA y 4qB. Son posibles infinitas combinaciones, siempre que obedezcan ciertos principios: 1 ) Las sondas deben estar o tener especificidad de posición. El término "ubicación-específica" indica en la presente sondas que, en las condiciones experimentales específicas utilizadas, hibridarán con uno de los cromosomas (por ejemplo el cromosoma 4 o el 10) o con uno de los haplotipos (por ejemplo el haplotipo qA o el qB) y no con el otro. El término "especificidad de posición" indica en la presente sondas que hibridan con ambos cromosomas (por ejemplo los cromosomas 4 y 1 0) o ambos haplotipos (por ejemplo ambos haplotipos qA y qB ), aunque en diferentes posiciones con relación al arreglo repetido o con relación a otra sonda. 2) Cada cromosoma o haplotipo debe llevar una firma específica, es decir una sucesión de sondas en la cual la longitud y "color" de las sondas y la posición relativa de las sondas son únicas y distinguibles de las sucesión de sondas en el otro cromosoma o haplotipo, en las condiciones experimentales usadas (por ejemplo las distancias deben ser distinguidas en la resolución del método de medición usado). 3) En una técnica donde la integridad del sitio no es completamente controlable y ocurren rupturas en ubicaciones aleatorias, tal como en el Peinado Molecular, es importante mantener las sondas tan cerca como sea posible al arreglo repetido con el fin de incrementar la probabilidad de que cada copia del sitio en un análisis sea completa. 4) La robustez del método con respecto a las condiciones experimentales (que pueden influenciar la especificidad de la secuencia de la hibridación, resolución , etc. ) y las variaciones genéticas en la población (por ejemplo, rearreglos no patogénicos o variaciones de secuencias en la vecindad del sitio FSHD) aumentará si hay redundancia en las firmas, es decir, si un cromosoma o haplotipo puede llevar varias firmas específicas.
Siguiendo estas reglas, el experto en la técnica puede diseñar conjuntos de sondas que son adecuadas para la técnica específica que usa, teniendo en cuenta los parámetros tales como precisión de las mediciones, especificidad de secuencia de la hibridación, número de etiquetas diferentes (por ejemplo, fluoróforos o haptenos detectados mediante fluorescencia) que pueden fijarse a las sondas, etc. Siguen algunos ejemplos de diseños alternativos. Se debe notar que las estrategias descritas dependen de las secuencias publicadas más generalmente aceptadas para las regiones involucradas. Si se dispone de información más completa o más exacta, el experto en la técnica puede aprovechar muy bien la nueva información para adaptar el diseño de la sonda siguiendo los principios antes descritos y ejemplificados más adelante. 5.1.2 4qA/4qB (Fig ura 4) Las diferencias de secuencias entre estos haploti pos, como se puede inferir de las secuencias publicadas de estos haplotipos son las siguientes (ver Figura 4, panel A): - En el haplotipo qA, se localiza un arreglo repetido de una secuencia beta-satélite de 68 pares de base inmediatamente corriente abajo de arreglo repetido D4Z4 (ver más adelante una descripción de la terminación del arreglo repetido en qA versus qB ). La longitud total de este arreglo repetido beta-satélite no se conoce con precisión . De acuerdo con nuestras observaciones, se extiende sobre una región de aproximadamente 5 kb. Sin embargo, algunos autores la reportan como de 8 kb de largo (Lemmers et al . , 2002). Este arreglo repetido beta-satélite es seg uido por un arreglo repetido de aproxi madamente 1 kb de unidades repetidas teloméricas (TTAGGG )n. Estos dos arreglos repetidos no están presentes en el haploti po q B en la vecindad inmediata de D4Z4 ; - En el haplotipo qB , está presente una secuencia de aproximadamente 6 kb inmediatamente corriente abajo del arreglo repetido D4Z4. Esta secuencia, llamada q B 1 no está presente en el haplotipo qA en la vecindad del arreglo repetido D4Z4. Sin embargo , está presente u n estiramiento de 300 bp en esta secuencia tanto en qB (500 bp corriente abajo del extremo telomérico del arreglo repetido D4Z4) como en qA en la orientación inversa (en dos sitios, aproximadamente 1 .5 kb y aproximadamente 1 0 kb respectivamente corriente abajo del extremo telomérico del arreglo repetido beta- satélite. Además, la secuencia qB1 comprende unidades repetidas internas invertidas: bases 1 a 1 , 500 de qB 1 corresponden a la copia invertida de bases 3,800 a 5,000, con la inserción del estiramiento de 300 bp antes mencionado (ver Figura 4); - En el haplotipo qA, se localizan dos secuencias de aproximadamente 750 bp y 1 ,900 bp respectivamente a 2.5 kb y 8.5 kb corriente abajo del extremo telomérico del arreglo repetido beta-satélite. Estas secuencias, denominadas qA1 y qA2 respectivamente no están presentes en el haplotipo qB, excepto el estiramiento de 300 bp antes mencionado, el cual se encuentra en la secuencia qA2 y en orientación inversa en la secuencia específica de qB; - Se debe notar que el arreglo repetido está terminado de manera diferente en los haplotipos qA y qB , de acuerdo con las secuencias publicadas. De hecho, la última repetición en el arreglo repetido en los haplotipos qA es una repetición D4Z4 variante, denominada pLAM (van Deutekom et al . , 1993). La secuencia publicada para pLAM (van Geel et al . , 2002, # 1 1 74497.1 de acceso genbank) muestra una repetición D4Z4 parcial que se extiende sobre 1 .9 kb, seguida por algunos elementos de repetición corta (<80 bp) de la secuencia D4Z4 separada por algunas decenas de pares de base de secuencia específica, antes del comienzo del arreglo repetido beta-satélite; - Adicionalmente, si la hipótesis de acuerdo con la cual las secuencias teloméricas en los cromosomas del haplotipo 4qA son idénticas a aquéllas en el cromosoma 1 0, es verdadera, la comparación de las secuencias 4qB y 1 0 muestra una secuencia específica 1 0q- adicional (y por lo tanto 4qA-), que no tiene similitud con el extremo telomérico de 4qB. Esta secuencia, -1 1 kb de largo, es de hecho la prolongación de qA2. Denominamos a esta secuencia qA3. 5.1 .2a Diseños de un color (Figura 4, paneles B y C) Se considera preferible mantener solamente una etiqueta para todas las sondas de ubicación, solamente las longitudes y posiciones relativas de las sondas de localización pueden permitir la distinción de dos firmas diferentes para los haplotipos qA y qB.
El Peinado Molecular junto con nuestro procedimiento de hibridación permite detectar sondas tan pequeñas como de pocos cientos de pares de base. Sin embargo, por debajo de unos pocos kb (~5 kb), la eficiencia de detección (es decir, la proporción del número de sondas detectadas realmente/número de sitios relevantes presentes en el portaobjetos) cae significativamente. Los espacios entre sondas deben ser de por lo menos 4 kb de ancho para identificarlos realmente como espacios. La desviación estándar de la medición de tamaño puede considerarse como la suma de un factor constante, en el orden de magnitud de 1 kb, y un factor relativo, de aproximadamente 0.1 x (tamaño de sonda medida). Por lo tanto, las sondas más pequeñas que 2 kb pueden ser distinguidas difícilmente por su tamaño, pero una sonda de 2 kb (sd = 1 .2 kb) y 5 kb (sd = 1 .5 kb) aparecerá muy diferente en una mayoría de mediciones.
La región qB 1 es la única región de qB específica, así es importante mantener una sonda con eficiencia de detección suficientemente alta, es decir, mayor que 5 kb. Por lo tanto, cubrir la región qB 1 con una sonda parece un aspecto común necesario de cualquier diseño de sonda qA/qB para Peinado Molecular con el procedimiento de hibridación descrito (Figura 4, panel B). Con las repeticiones internas de qB 1 , sin embargo, esto no requiere necesariamente usar la región qB1 completa como la plantilla para sondas, ya que omitiendo las bases de 4,000 a 6,000 se permitiría aún que la sonda hibride en 5 kb de la secuencia (opción de fondo para qB en la Figura 4, panel B). Omitir las bases de 1 a 1 ,500 de esta región de aproximadamente 6 kb permitiría que la sonda hibride sobre la secuencia completa excepto para el estiramiento de 300 bp antes descrito. Esta última solución permitirá la hibridación de la sonda en la región de qB 1 de 6 kb, con un espacio interno de 300 bp que no afectará la detección o identificación de la señal como una sonda de 6 kb dado su tamaño pequeño, y sin hibridación cruzada en qA.
Una sonda que cubre la secuencia beta-satélite repetida hibridará necesariamente en el arreglo repetido beta-satélite completo, apareciendo así como una sonda de ~5 kb, con variación significativa en la población . Así, sería difícilmente distinguible de una sonda qB 1 de 6 kb si se etiqueta con la misma etiqueta, puesto que ambas hibridan inmediatamente corriente abajo del arreglo repetido D4Z4. Por lo tanto, en un esquema de un color, aparece que las únicas secuencias utilizables específicas de 4qA son qA1 y qA2. Dado que su tamaño, 800 bp y 1 ,900 bp, no es distinguible con el procedimiento descrito, y que su eficiencia de detección ya es ineficiente por su tamaño pequeño, es preferible optimizar la eficiencia de detección cubriendo la secuencia completa para cada sonda (Figura 4, panel B). es posible obviamente, usar solamente una de las dos sondas en lugar de ambas sondas, ya que esto generaría una señal corta (<2 kb) de aproximadamente 1 0 a 1 5 kb corriente abajo del extremo telomérico del arreglo repetido D4Z4, fácilmente distinguible de la señal de 6 kb adyacente al arreglo repetido D4Z4 en qB. Sin embargo, puesto que la eficiencia de detección no es de 1 00% para estas sondas, la probabilidad de detección por lo menos una - que es suficiente para distinguir qA de qB - es mayor cuando se usan ambas sondas.
Adicionalmente, si la secuencia 1 0q publicada se muestra para representar confiablemente la secuencia 4qA, se puede usar también el estiramiento qA3. Cualquier tamaño de sonda por arriba de 5 kb se detecta eficientemente y la ubicación de tal sonda, por lo menos a 10 kb corriente abajo de la repetición D4Z4, permitirá distinguirla de la sonda qB 1 . Por ejemplo, se puede usar una sonda que se extiende más de 5 kb desde el extremo de las secuencias 4qA/4qB compartidas. Esta sonda podría usarse junto con o en lugar de las sondas qA1 y qA2.
Si las adaptaciones de la tecnología de Peinado Molecular, o tecnologías relacionadas donde se pueden medir varias distancias físicas en moléculas sencillas, tienen características diferentes en términos de eficiencia de detección, precisión de medición, resolución de sondas, etc. , el diseño de las sondas de localización puede ser significativamente diferente.
Por ejemplo, si una sucesión de tres sondas de 1 kb separadas por espacios de 1 kb fueran fácilmente distinguibles de una sonda de 5 kb, sería aconsejable cubrir la región qB 1 con una sucesión de sondas y usar la región repetida beta-satélite en qA como su firma específica -potencialmente junto con las regiones qA1 y qA2 (Figura 4, panel C).
Otra opción, si la eficiencia de detección de una sonda de 300 bp no es un problema, sería usar la secuencia de 300 bp antes mencionada como una sola sonda para distinguir qA de qB: de hecho, esta sonda híbrida aproximadamente a 500 bp del extremo telomérico del arreglo repetido D4Z4 en qB , y aproximadamente a 1 .5 kb corriente abajo del extremo telomérico del arreglo repetido beta-satélite, o más de 6 kb corriente abajo del extremo telomérico del arreglo repetido D4Z4, de manera que su posición con relación al arreglo repetido D4Z4 sería suficiente para permitir la distinción. 5.1.2.b Diseños de varios colores Si se pueden usar varias etiquetas diferentes para las sondas de ubicación , son posibles otras opciones para distinguir qA y qB. Obviamente, usar dos colores permitiría el uso de una o varias sondas que hibridan con el arreglo repetido beta-satélite en qA y una o varias sondas que hibridan con la región qB 1 conjuntamente, siempre que las sondas correspondientes se etiqueten de manera diferente (y también de manera diferente de la sonda repetida, ver Figura 4, panel D). Estas dos sondas serían suficientes realmente para hacer la distinción entre los haplotipos qA y qB, aunque queda la posibilidad de usarlas junto con qA1 y/o qA2. Naturalmente, son posibles otros esquemas, y numerosas opciones válidas surgirán si se usan más colores. Inspirado por el razonamiento anterior, el experto en la técnica logrará fácilmente un diseño que optimice el uso de estos colores.
También es posible alcanzar un resultado cercano usando solamente dos etiquetas, pero permitiendo la combinación de estas dos etiquetas para las sondas. Por ejemplo, en nuestra técnica las etiquetas usadas son biotina y digoxigenina, principalmente. Es posible, cuando se etiquetan las sondas mediante cebado aleatorio o los similares, incorporar ambas etiquetas.
Alternativamente, se pueden realizar dos reacciones separadas, seguidas por el mezclado de sondas etiquetadas con digoxigenina y biotina. Puesto que varios fragmentos, cada uno típicamente de algunos cientos de pares de base de largo, hibridan con regiones objetivo grandes (>algunos kb), es posible lograr el etiquetado de una región con dos etiquetas, lo cual aparecerá como una superposición de colores después de la detección . Esto se puede considerar un "tercer" color en comparación con los dos colores "puros".
En el ejemplo anterior, sería posible etiquetar, por ejemplo, la región beta-satélite con dos colores, permitiendo así la distinción entre la sonda repetida con una etiqueta (por ejemplo, biotina) y la sonda qB1 de una etiqueta (por ejemplo, digoxigenina). En este caso, la longitud del arreglo repetido en un cromosoma qA se determina como la diferencia entre el segmento etiquetado con biotina (que representa el arreglo repetido D4Z4 y las beta-satélites adyacentes) y el segmento (que representa el arreglo repetido beta-satélite solo) etiquetado con digoxigenina. Esta medición indirecta de la longitud del arreglo repetido puede, sin embargo, obstaculizar la precisión de esta medición. 5.1.3. 4q/10q (Figura 5) Globalmente, de acuerdo con la información publicada, las regiones teloméricas 4q y 10q son idénticas en una región que comprende el arreglo repetido D4Z4, las secuencias corriente abajo (que son reportadas idénticas en 1 0q y en el haplotipo 4qA) y secuencias corriente arriba en 45 kb (Figura 5, panel A).
En el cromosoma 1 0q, corriente arriba de la secuencia 4q/10q común hay un estiramiento de 35 kb de secuencias específicas para 1 0q (es decir, no encontradas en 4q en la región de aproximadamente 100 kb corriente arriba del extremo centromérico del arreglo repetido D4Z4), denominado 10q 1 . Corriente arriba de la secuencia 1 0q1 hay un estiramiento de aproximadamente 7 kb que tiene múltiples copias o copias invertidas en el cromosoma 4q.
En el cromosoma 4q, corriente arriba de la secuencia 4q/10q común están, ordenados de la región telomérica a la centromérica, una repetición D4Z4 invertida, una región específica de aproximadamente 1 0 kb (denominada 4q 1 ), una región de aproximadamente 20 kb con copias o copias invertidas de secuencias encontradas también en 10q (corriente arriba de la secuencia 10q 1 ), una secuencia específica de aproximadamente 20 kb (denominada 4q2), una secuencia de aproximadamente 7 kb la cual es una copia de una secuencia encontrada en 1 0q corriente arriba de 10q1 y una secuencia específica de aproximadamente 35 kb (denominada 4q3). Corriente arriba de las secuencias aquí descritas hay esencialmente una secuencia específica para cada cromosoma. 5.1.3.a Diseños de un color Dadas las regiones amplias que son específicas de cromosoma, hay múltiples diseños posibles para sondas que deben permitir la distinción robusta entre arreglos repetidos colocados en 4q y 1 0q.
Entre las opciones está la posibilidad de beneficiarse de todas las cuatro regiones específicas descritas antes (4q 1 , 4q2 , 4q3, 1 0q 1 ).
Sin embargo, este diseño tiene dos defectos: 1 ) en el caso donde un sitio 1 0q se rompe durante el proceso de Peinado Molecular en la región 10q 1 , dejando solamente -1 0 kb de la secuencia 1 0q 1 , la señal aparecerá de manera indistinguible de un sitio 4q roto entre las secuencias 4q 1 y 4q2, es decir, una sonda de 1 0 kb separada por un espacio de -45 kb del arreglo repetido D4Z4; y 2) las sondas 10q1 y 4q3 tienen la misma longitud . Así, si en un rearreglo las sondas 4q2 y 4q 1 se pierden, los cromosomas 1 0q y 4q exhibirán señales idénticas.
Las opciones de un solo color que creemos que tienen la mejor robustez predecible son opciones donde ninguna sonda en un cromosoma iguala - en tamaño - a una sonda de otro cromosoma. Por las razones ya mencionadas, es aconsejable tener varias sondas en cada cromosoma. Con el fin de mantener el código tan compacto como sea posible, seleccionamos los tamaños mínimos que son detectados eficientemente y distinguidos fácilmente, es decir, 5 y 10 kb. Los espacios deben seguir la misma regla y en consecuencia seleccionamos también espacios de 5 y 10 kb (Figura 5, panel B).
Por razones técnicas, a saber la dificultad para amplificar parte de la región específica de 4q mediante PCR, remplazamos eventualmente la sonda de 10 kb más cercana al centrómero en 4q por una sonda de 7.5 kb; el espacio entre ésta y la sonda vecina se mantuvo sin embargo en 1 0 kb. Esto ilustra el hecho de que son posibles variaciones en los códigos descritos y no modifican significativamente el concepto.
Sería posible asociar sondas de 5 kb con espacios de 1 0 kb y sondas de 10 kb con espacios de 5 kb. Sin embargo, en este caso , si , por ejemplo, una de las sondas de 10 kb híbrida de manera incompleta, en solamente 6 kb, el espacio correspondiente se extendería hasta 9 kb, apareciendo así como una sonda de 6 kb y un espacio de 9 kb, lo que podría ser confundido posiblemente con la asociación de sonda de 5 kb/espacio 10 kb. En un esquema donde sondas y espacios de 5 kb están asociados, así como también sondas y espacios de 10 kb, no es posible que ocurra esto.
El espacio "principal" entre las sondas específicas de cromosoma y el arreglo repetido D4Z4 es por lo menos de 42 kb de largo en el cromosoma 1 0q y de 45 kb en el cromosoma 4q (debido a la repetición D4Z4 invertida). Colocando las sondas inmediatamente corriente arriba de este espacio se permitiría el código más compacto. Sin embargo, el tamaño de este espacio "principal" se puede usar también para distinguir sondas 4q y 10q, por ejemplo si la fibra se rompe y solamente permanece la sonda más próxima. Así , escogimos mantener un espacio de 45 kb en el cromosoma 1 0, pero establecer un espacio de -65 kb en el cromosoma 4.
Naturalmente, aún con un color hay infinitos diseños válidos, lo cual puede ser más adecuado para otras tecnologías u otras condiciones experimentales si las especificaciones técnicas de la tecnología difieren significativamente de nuestra implementación de Peinado Molecular. Siguiendo el razonamiento antes descrito, es fácil encontrar un diseño válido.
De manera importante, hemos considerado solamente regiones donde las secuencias son suficientemente divergentes para obtener la especificidad de hibridación de las sondas. Si es posible distinguir más divergencias sutiles de secuencias mediante la hibridación de sondas, es aconsejable considerar la región más cercana a los arreglos repetidos D4Z4 donde las diferencias sutiles entre los cromosomas 4q y 10q existen como objetivos para diseñar sondas, permitiendo así un * código más compacto. 5.1.3.b Diseños de varios colores Si están disponibles colores adicionales para la detección de sondas, las posibilidades son aún más numerosas. Un uso sencillo de un tercer color sería diseñar un juego de sonda con un color para un cromosoma (por ejemplo, rojo para 4q), otro color para el otro cromosoma (por ejemplo, verde para 10q), mientras que se mantiene un color para el arreglo repetido (por ejemplo, azul). Entonces sería mejor mantener un patrón de sondas (por ejemplo, cuatro sondas de 5 kb separadas por espacios de 5 kb) con el fin de mantener la robustez con relación a rearreglos de hibridación e inesperados relativos (Figura 5, panel C), pero otra opción es diseñar una sola sonda en cada uno de los cromosomas dentro de las regiones específicas antes descritas (Figura 5, panel D). Con este tipo de diseño de sonda, donde el color solo es suficiente para distinguir los dos cromosomas, es posible usar técnicas de ensayo de ADN donde no son posibles las mediciones precisas de longitud de secuencias. 5.2 Sondas D4Z4 y eval uación de número de copias repetidas (Fig ura 6) 5.2.1 Diseño "simple" (Figura 6, panel B) El enfoque más directo para estimar el número de unidades repetidas D4Z4 en un arreglo repetido es diseñar una sonda que cubre la secuencia completa de una unidad repetida D4Z4 (Figura 6, panel A: sonda "DZ"). Esta sonda hibridará como un segmento que cubre el arreglo repetido completo. Si se conoce la proporción (longitud física)/ (longitud de secuencia), que es el caso con la técnica de Peinado Molecular, la medición de este segmento proporcionará la longitud en kb del arreglo repetido, y dividiendo entre 3.3 kb (la longitud de una repetición), el número de unidades repetidas.
Algunas correcciones pueden ser factorizadas para agregar precisión a este método de cuantificación de las unidades repetidas. De hecho, como se estableció antes, es posible tener un número no entero de unidades repetidas. Si se depende de la información publicada y se determina el haplotipo, la longitud de la última repetición incompleta, pueda restarse antes de la conversión de kb a número de unidades repetidas. Por ejemplo, un segmento de arreglo repetido identificado como estando en un cromosoma qA de haplotipo contendrá (longitud medida de segmento en kb - 2 kb)/unidades repetidas enteras de 3.3 kb además de la secuencia pLAM , puesto que la sonda D4Z4 hibridará en ~2 kb de la secuencia pLAM . 5.2.2 Diseño de "una mitad" (Fig ura 6, panel C) Algunas mejoras del enfoque previo se pueden encontrar con el fin de hacer más fácil, más precisa y/o más robusta la determinación del número de unidades repetidas. Además de estas ventajas, los enfoques descritos más adelante pueden proporcionar también una vista interior de la organización física del arreglo repetido, por ejemplo revelar la existencia de unidades repetidas orientadas de manera inversa. Además, la técnica de conteo directo descrita en la presente se podría aplicar también a otras técnicas de ensayo de ADN donde la topología de las secuencias se conserva en la región de interés, pero donde no son posibles mediciones precisas de longitud de secuencia.
En las dos alternativas y sus variantes descritas más adelante, hemos escogido cubrir la secuencia D4Z4 con dos sondas, denominadas Dee y Zee. que cubren respectivamente la región centromérica y la telomérica, sobre 1 .7 kb (las sondas tienen un ligero traslape de secuencia sobre 100 bp en el centro de la secuencia D4Z4).
En un primer paso, si se mantiene solamente un color para etiquetar el arreglo repetido, es posible usar solamente una de las sondas, ya sea Dee o Zee en la hibridación. Esto conduce a un arreglo repetido que se detecta como una sucesión de sondas cortas de 1 .7 kb separadas por espacios de 1 .5 kb. La evaluación del número de copias repetidas se puede lograr mediante el conteo del número de sondas. Alternativamente, o como un control , la longitud física del arreglo se puede medir midiendo la distancia entre el comienzo de la primera sonda hasta el final de la última. Como en el montaje previo, se puede deducir el número de unidades repetidas a partir de esta medición . También como se subrayó previamente, se pueden calcular algunos factores de corrección. Por ejemplo, la sonda Zee podría no hibridar en los 1 .5 kb en el extremo centromérico de la repetición y podría terminar antes de la secuencia pLA .
Esta técnica de conteo directo puede proporcionar también alguna información sobre la organización física del arreglo repetido: una sucesión de dos unidades repetidas orientadas de manera diferente dentro del arreglo aparecería ya sea como una sonda de 3.4 kb o como un espacio de 3 kb, siempre que la precisión de medición de la técnica sea suficiente para distinguir aquéllos de sondas 1 .7 kb o espacios de 1 .5 kb. La orientación de cada unidad repetida en el arreglo se deduce entonces de las posiciones de las inversiones sucesivas. Se debe enfatizar sin embargo que este enfoque puede no permitir la distinción de una inversión en la secuencia a partir de una eliminación de una fracción de una repetición o la inserción de secuencias no relacionadas. 5.2.3 Diseño de "dos mitades" (Figura 6, panel D) En un segundo paso, se pueden cubrir las dos mitades de la secuencia D4Z4 mediante una sonda cada una, con diferentes colores, por ejemplo Dee detectada en rojo y Zee en verde. En este montaje, el arreglo repetido aparecerá como una sucesión de sondas de 1 .7 kb rojas y verdes, con un ligero traslape sobre 1 00 bp (ver Figura 6). De una manera similar al montaje previo, las unidades repetidas se pueden contar directamente contando el número de motivos rojo-verde, y/o midiendo la longitud total del arreglo repetido. También , serán detectadas las inversiones de unidades repetidas como segmentos de 3.4 kb rojos o verdes. Aquí, hay alguna robustez agregada en comparación con el montaje previo hacia eventos tales como eliminaciones internas o inserción de secuencias no relacionadas, puesto que éstas aparecerían como inconsistencias en el conteo y la orientación de las unidades repetidas o espacios, respectivamente. También, en comparación con el diseño "simple" donde una sonda cubre toda la secuencia, se agrega robustez hacia hibridación no específica, puesto que el motivo de arreglo repetido es más específico. 5.2.4 Variaciones del diseño de sonda repetida Las variaciones en los diseños antes descritos pueden incluir ya sea seleccionar sondas de tamaños diferentes, o variar el tamaño de traslape (hasta la longitud repetida y hasta cero), introduciendo un espacio entre las dos sondas, o dividiendo la secuencia D4Z4 de manera diferente (es decir, seleccionar otra "base de partida" para D4Z4). Esto no traería mayores cambios al concepto. Se debe tener cuidado de no diseñar sondas muy pequeñas para la detección eficiente y tampoco incluir unidades repetidas internas en la secuencia D4Z4 en dos sondas diferentes para evitar la hibridación cruzada. En nuestro diseño, las unidades repetidas internas principales están todas incluidas en la sonda Dee.
El detalle adicional de la secuencia D4Z4 probaría probablemente la dificultad para implementar con las características técnicas de la técnica de Peinado Molecular en nuestras condiciones experimentales, puesto que las sondas serían más pequeñas que 1 .7 kb, detectando entonces menos eficientemente y probablemente se haría difícil de resolver. Sin embargo, con técnicas de mayor resolución o implementaciones de Peinado Molecular que aumentarían la resolución y detección de sondas pequeñas, el experto en la técnica adaptaría fácilmente este diseño para aprovechar al máximo las características técnicas de la técnica. En este caso, si se usan más de dos segmentos para cubrir la unidad repetida D4Z4, es aconsejable usar más de dos colores diferentes (o mezclas de colores) para etiquetar los segmentos.
Si se usa uno o dos - o más - colores para etiquetar el arreglo repetido D4Z4, es aconsejable no usar estos colores para cualquiera de las sondas de ubicación , con el fin de excluir cualquier interpretación errónea, por ejemplo, en el caso de un rearreglo inesperado. Si solamente se van a usar dos colores en total , los diseños de un color para las sondas de ubicación y el diseño simple o el diseño de una mitad para la sonda repetida en otro color parece ser la mejor alternativa. Si se usan tres colores (o dos colores y una mezcla de los dos colores), se puede escoger ya sea mantener dos colores para la sondas de ubicación por las razones antes establecidas o mantener los diseños de un color para las sondas de ubicación y para adoptar el diseño de dos mitades para el arreglo repetido. Si es necesaria la información proporcionada de ambos métodos, es posible obviamente reunir información de dos hibridaciones separadas con diseños diferentes. Con cuatro colores, es posible implementar tanto los diseños de dos colores para las sondas de ubicación como el diseño de dos mitades, logrando así un nivel óptimo de detalle con nuestras condiciones experimentales. 5.3 Análisis de resultados Para el análisis óptimo de los resultados, es necesario determinar la desviación estándar (sd) de las mediciones para la técnica usada . En los ejemplos más adelante, consideramos la sd para la medición de un segmento de longitud L como 1 kb + 0.1 L. Estos valores, de acuerdo con nuestra experiencia con el Peinado Molecular, deben adaptarse a las condiciones experimentales específicas usadas. Como se estableció antes, el número de unidades repetidas puede ser determinado midiendo el arreglo repetido y, siempre que estén presentes las sondas de ubicación, este número de unidades repetidas puede vincularse con un cromosoma y un haplotipo. Sin embargo, la precisión de una sola medición es insuficiente para evaluar el número de unidades repetidas con certeza .
Por ejemplo, el error en una medición puede alcanzar 8.6 kb (2.sd) en un arreglo repetido de 3.3 ( 10 repeticiones) de largo. Así, si solamente se hace una medición , los resultados deben ser indicados como 7-1 3 unidades repetidas [24.4; 41 .6 kb] . A la óptica de los diagnósticos, el umbral entre individuos saludables y portadores de la enfermedad se cree que es de 10 unidades repetidas, esto conduciría a una incertidumbre en el diagnóstico. La precisión de medición se puede mejorar dramáticamente mediante la consideración de varias medidas del mismo alelo. En el ejemplo previo, si se hacen 28 mediciones y el promedio es de 33 kb, el intervalo de confianza se disminuye hasta [31 .4; 34.6 kb] (2.sdA/28~1 .6) , y así se puede reportar el número de unidades repetidas como 1 0 con relativa certeza. Se pueden encontrar varios enfoques para calcular el tamaño promedio con un número suficiente de mediciones. 5.3.1 Enfoque astringente En el enfoque más simple, solamente se consideran señales asignadas de manera ambigua a un cromosoma y haplotipo. En un caso simple, solamente existe un alelo para un cromosoma y haplotipo específico. En un individuo heterocigótico para el haplotipo 4q (4qA/4qB), por ejemplo, solamente existe un alelo para 4qA. Todos los arreglos repetidos asignados a 4qA pueden medirse entonces y el promedio medido se toma como la determinación de tamaño para el alelo 4qA. La presencia de sondas en ambos lados (centromérico y telomérico) del arreglo repetido prueba que las moléculas de ADN no se rompieron dentro del arreglo repetido y se puede tomar como hipótesis que las mediciones siguen una distribución de Gauss. La mitad del ancho del intervalo de confianza en este caso se puede estimar como 2.sd/Vn, donde n es el número de mediciones para este alelo. A la óptica del diagnóstico, el número de mediciones se considera suficiente cuando el intervalo de confianza para el número de unidades repetidas está completamente dentro del rango "saludable" o dentro del rango "patológico". Si se pueden extraer beneficios adicionales de una evaluación más precisa (por ejemplo si el número preciso de unidades repetidas en el rango patológico permite predecir la severidad de la enfermedad ), se pueden agregar mediciones adicionales hasta que el intervalo de confianza es suficientemente angosto para la interpretación más precisa posible.
En una situación más compleja, dos alelos pueden compartir la misma asignación de cromosoma y haplotipo. Este es el caso para un homocigoto 4qA/4qA individual , o en cromosoma 10 si ambos cromosomas 1 0q tienen el haplotipo qA esperado. En este caso, un primer paso en la interpretación debe ser el análisis de la distribución de mediciones, por ejemplo mediante la visualización del histograma de tamaños de arreglos repetidos. En los casos considerados, si los dos alelos tienen tamaños "suficientemente diferentes", se espera que aparezcan en el histograma dos picos distintos (dos modos). Los dos modos pueden ser considerados entonces como los tamaños de los dos alelos. Alternativamente, el promedio de los valores "dentro de un pico" - como se define más adelante - puede ser preferido como la mejor suposición para el tamaño de cada alelo. Para calcular la mitad de ancho del intervalo de confianza como antes, es necesario considerar el número de mediciones en cada pico. Se puede considerar, por ejemplo, todas las mediciones en el intervalo [modo-2.sd ; modo + 2.sd] como pertenecientes a un alelo, siempre que los intervalos para los dos alelos no traslapen .
En casos donde las longitudes de los dos alelos no son suficientemente diferentes para que se separen claramente los dos picos, una solución posible es encontrar la superposición de dos distribuciones de Gauss que ajuste mejor con la distribución observada. Los parámetros para las dos distribuciones a ser acomodadas son el tamaño promedio, la desviación estándar y el tamaño de la muestra dentro de cada alelo (número de observaciones que corresponden a cada alelo). La distribución observada proporcionará valores aproximados para las distribuciones a ser acomodadas y los tamaños promedio para las distribuciones acomodadas son discretos puesto que corresponden a un número entero de unidades repetidas. Se puede suponer la desviación estándar a partir del conocimiento de la técnica. Los tamaños de muestra están vinculados por n1 + n2 = n donde n 1 y n2 son tamaños de muestra para cada alelo y n es el número total de observaciones para este cromosoma y haplotipo. Además, se puede suponer que n1 y n2 son aproximadamente iguales. Las combinaciones de parámetros están , entonces, en número finito, y este enfoque es relativamente fácil de implementar. Aunque todos estos pasos pueden ser implementados manualmente por el experto en la técnica, es posible también usar software apropiado, por ejemplo análisis estad ístico. 5.3.2 Enfoques relajados: señales no ubicadas, intactas La mayor desventaja del "enfoque astringente" es que requiere un número potencialmente elevado de mediciones para cada alelo. Con nuestra implementación de Peinado Molecular, el número de señales resultantes del análisis de una superficie hibridada completa (22 x 22 mm) fluctúa desde 100 hasta 400. Así, se esperan de 25 a 1 00 copias de cada alelo, pero solamente una fracción de éstas contiene el sitio FSH D intacto con el arreglo repetido y sus sondas circundantes. Esto puede disminuir el número de mediciones asignadas específicamente a un sitio y con un arreglo repetido intacto para tan pocas como 5 señales o menos para un alelo. En este contexto, la reunión del número de señales adecuado para una determinación no ambigua requerirá altas cantidades de tiempo y costos elevados. Con el fin de alcanzar tal resultado con menos recursos, es posible disminuir la astringencia de los criterios para la inclusión de mediciones en el análisis.
En un primer paso hacia criterios relajantes, uno puede desear incluir información para la cual el arreglo repetido está rodeado por sondas, y puede considerarse entonces con seguridad como intacto , pero donde no se conocen con certeza el cromosoma y/o el haplotipo exactos. Por ejemplo, si solamente la sonda más próxima del motivo de cuatro sondas para la ubicación cromosomal permanece, debido a la ruptura de la molécula de ADN , la asignación no ambigua al cromosoma 4 o 1 0 puede no ser posible. Todas las mediciones intactas se pueden graficar en un histograma . Se espera desplegar cuatro picos en un individuo normal, que corresponde a los dos alelos en cada uno de los cromosomas 4q y 1 0q. El tamaño de cada alelo y el número de mediciones individuales en cada pico (y, así, el intervalo de confianza) se pueden evaluar mediante métodos similares a aquéllos antes descritos.
Algunas de las mediciones dentro de cada tipo deben ser asignadas de manera no ambigua a un cromosoma y haplotipo. Si los picos son distintos, solamente se encontrará una "especie" de mediciones en un pico, y entonces el tamaño y el intervalo de confianza se pueden asignar a un cromosoma y haplotipo. Esto permanece posible si no se puede asignar medición en el pico de manera no ambigua a un cromosoma y haplotipo dados, siempre que exista en el pico por lo menos una medición asignada sin ambigüedad a un cromosoma dado y una a un haplotipo dado. Si dos picos con idéntica asignación de cromosoma y haplotipo traslapan, el método de interpolación es similar a aquél antes descrito para el enfoque astringente con picos traslapantes. Si dos picos traslapan y por lo menos una característica (cromosoma o haplotipo) permite distinguir dos poblaciones en los picos, el método preferido es graficar por separado los histogramas para los dos valores posibles de esta característica. Así, solamente uno de los dos picos debe permanecer en cada histograma y se puede aplicar el mismo razonamiento anterior.
En este montaje, solamente se consideran las señales intactas y es importante, entonces, por si mismo ensayar si un arreglo repetido está intacto, independientemente de la asignación a un cromosoma y/o haplotipo. Teniendo esto en consideración , uno puede desear el diseño de sondas adicionales a aquéllas descritas anteriormente para este único propósito. Una sonda que cubre la región común para 4q y 10q, por ejemplo, que podría hibridar cerca del arreglo repetido en su lado centromérico, permitiría decir que el arreglo no se rompió en el extremo centromérico aún si la molécula se hubiera roto después corriente arriba, excluyendo la detección de las sondas específicas de cromosoma. Este razonamiento se puede adaptar también a las secuencias teloméricas, donde secuencias comunes a haplotipos qA y qB existen y pueden utilizarse. 5.3.3 Enfoque relajado: señales no ubicadas, no intactas Uno puede desear criterios de relajación adicionales para la inclusión de mediciones, que conducen a tamaños de muestra aún más grandes. Por ejemplo, se puede aceptar como válida una medición de un arreglo repetido con sondas solamente en un lado. En este caso, el arreglo repetido puede ser interrumpido por una ruptura en la molécula de ADN y la medición puede no corresponder a la longitud total del arreglo repetido. La principal desventaja en este caso es la existencia de mediciones que representan solamente fracciones de arreglos repetidos, que pueden ser incluidas cuando se calcula el tamaño promedio y conducir así a una subestimación del tamaño del arreglo repetido.
Este enfoque puede dar aún resultados satisfactorios, sin embargo, si la fracción de arreglos repetidos rotos en la información considerada no es muy alta. En nuestro diseño de un color para sondas, por ejemplo, con qA que se detecta como dos sondas cortas, la eficiencia de detección no es de 1 00%. Así, pueden aparecer arreglos repetidos intactos con solamente las sondas de ubicación centroméricas. Adicionalmente, la distancia entre las sondas centroméricas y el arreglo repetido (-50 kb) hace que una ruptura de la molécula de ADN en este espacio sea un evento probable. Así, pueden aparecer arreglos repetidos intactos con solamente las sondas teloméricas, o ninguna sonda de ubicación si la molécula se rompe y no se detectan las sondas qA. Por lo tanto, creemos que la fracción de arreglos repetidos intactos en las mediciones que no pudieran probarse como intactas es elevada, y que tiene sentido para factorizar estas mediciones en nuestro cálculo del tamaño promedio con nuestro montaje.
De manera importante, estos enfoques pueden combinarse y/o pueden adoptarse dependiendo de la precisión requerida de las mediciones. Por ejemplo, se puede adoptar un enfoque relajado en una primera corrida, lo que conduce a una estimación de los tamaños de alelo y permite la detección de un alelo 4qA potencialmente patogénico. Si la existencia de tal alelo puede ser excluida de este primer análisis rápido, y si esta es la única razón para realizar la prueba, no es necesario continuar más. Si aparece un alelo 4qA con un tamaño que puede estar en el rango patogénico, se puede realizar un análisis adicional (es decir, recolección de un número más grande de señales) para reunir información específica y precisa.
Puesto que un parámetro en el tiempo y costos requerido para un análisis es el número de fluorocromo usado (con un número mayor de fluorocromos, serán necesarios tiempos de adquisición más largos y la digitalización de una superficie dada será más lenta), es posible variar los parámetros de hibridación y/o adquisición para cumplir con el enfoque adoptado. De hecho, en el enfoque relajado solamente se usa el tamaño del arreglo repetido en cada señal . Las sondas de ubicación se usan solamente para asignar los picos a una combinación dada de cromosoma y haplotipo y esto requiere solamente unas pocas señales para cada alelo. Se podría considerar la digitalización de solamente la superficie necesaria para recolectar estas pocas señales con varios colores y recolectar rápidamente un número alto de mediciones mediante digitalización usando además solamente el color requerido para el arreglo repetido. 5.3.4 Mosaicismo Puesto que se sospecha que muchos individuos tienen mosaicismo somático para el sitio FSH D, se debe dar atención especial a la detección de tal evento. La habilidad para detectar un alelo de mosaico (es decir un alelo presente en solamente una fracción de células) depende de un número de factores, principalmente la fracción de células que llevan este alelo en la muestra analizada y el tamaño del alelo de mosaico con relación al tamaño de otros alelos. Por lo tanto, es imposible diseñar la prueba de tal manera que detecte siempre la existencia de un alelo de mosaico. Sin embargo, es posible realizar la prueba de tal manera que la detección de tal alelo se hace altamente probable (con una probabilidad arbitraria), siempre que se hagan algunas suposiciones. Esto requiere adaptar el razonamiento posterior en cada caso específico y con los requerimientos dictados por la aplicación.
Por ejemplo, en un montaje de diagnóstico, un facultativo podría considerar la existencia de un calibre de alelo de mosaico de 4qA en por lo menos 1 0% de células y con 1 0 unidades repetidas o menos como un evento que debe ser detectado con por lo menos 95% de probabilidad . En una primera corrida de la prueba , usando el enfoque astringente antes descrito, el único alelo 4qA es estimado en 1 7 unidades repetidas (56.1 kb, sd = 6.6 kb), el número m ínimo de señales para analizar y asegurar 95% de probabilidad de detección de un alelo de mosaico puede calcularse con base en el escenario de "peor caso". El caso más difícil para detectar sería un alelo de 1 0 unidades repetidas (33 kb, sd = 4.3 kb) en 10% de las células. Una señal del alelo mayor tiene menos de 2.5% de probabilidad de ser medida por debajo de 42 kb (56.1 -2 x 6.6 = 42.9). Por lo tanto, si se encuentran dos mediciones por debajo de este valor, el análisis concluirá correctamente que existe un alelo más pequeño. Si una de diez señales 4qA es del alelo de mosaico y se miden 80 señales 4qA, hay más de 96% de probabilidad de que el alelo de mosaico aparezca por lo menos dos veces, y las señales tienen 97.5% de probabilidad cada una de ser medidas por debajo de 42 kb (33 + 2 x 4.3 = 41 .6), de manera que hay globalmente más de 95% de probabilidad de detectar dos señales debajo de 42 kb y entonces detectar correctamente un alelo de mosaico. En este caso, para cumplir con los criterios clínicos, es necesario mantener el análisis de información hasta que se detectan 80 señales 4qA.
Se debe señalar que probablemente esto no sería suficiente para una evaluación correcta del tamaño del alelo de mosaico, de manera que puede ser necesario, cuando se detecta un alelo de mosaico, analizar un mayor número de señales. También, cuando se ha analizado un número suficiente de señales, se hace posible la estimación de la fracción de células que llevan el alelo de mosaico mediante la comparación del número de medidas en el pico de "mosaico" con relación a un pico homogéneo (no mosaico). Se puede calcular un intervalo de confianza para esta fracción usando estadísticas convenientes. 5.3.5 Sitio no canónico Los métodos antes descritos para analizar la información suponen que las señales detectadas pueden ser asignadas a uno de los motivos esperados en el esquema de sonda que fue seleccionado, o para parte de un motivo. Si la señal parece divergir de los motivos esperados ("canónicos"), se debe tener cuidado extraordinario en la interpretación. Es necesario asegurar que el motivo no canónico no es un artefacto experimental. Tales artefactos incluyen principalmente la probabilidad de que dos moléculas distintas de ADN que cubren parte de los sitios objetivo se alineen por casualidad en una superficie peinada. Si el motivo (o una parte del mismo diverge de los motivos canónicos) es encontrado varias veces en un análisis, se puede concluir con seguridad que no es el resultado de un artefacto.
Con el fin de interpretar la naturaleza precisa del rearreglo responsable del motivo no canónico , se puede realizar experimentos suplementarios de peinado molecular y/o usar otras técnicas de biología molecular (incluyendo PSR, secuenciado, southern bloting , CGH o CGH con base en arreglo, etc). La mayoría de las técnicas requieren alguna hipótesis del rearreglo, que equipara globalmente con una descripción del rearreglo con una resolución de algunos kb. Por lo tanto, tal descripción puede buscarse primero mediante experimentos suplementarios de peinado molecular.
Por ejemplo, si aparece una señal de hibridación donde no se esperaba la señal , que corresponde a la inserción de secuencias encontradas en una de las sondas, probablemente es mejor identificar primero la naturaleza de dicha señal (es decir, la sonda responsable de la señal), si no es inmediatamente deducible a partir de la etiqueta de la señal inesperada. Esto se puede lograr mediante hibridaciones donde se omiten una o varias sondas. Si se omite una sonda en un momento, el número de hibridaciones diferentes a ser realizadas es igual al número de sondas que comparten la misma etiqueta que la secuencia insertada. Si este número es muy grande, se puede adoptar un enfoque combinatorio, ejemplificado en la Figura 7, donde pueden omitirse varias sondas en un experimento. Se pueden distinguir 2n sondas posibles a partir de n experimentos de hibridación mediante tal enfoque. Es posible también usar otras etiquetas en lugar de o además de omitir sondas. Si se usan x etiquetas diferentes (en este número, la posibilidad de omitir una sonda se debe considerar una etiqueta), se pueden distinguir xn sondas posibles a partir de n experimentos de hibridación. Hibridar partes de la sonda generadora de señal puede permitir precisar adicionalmente la porción de la sonda que fue insertada si esto es necesario.
Como otro ejemplo, en el caso de una distancia más corta que la esperada entre dos sondas, que corresponde a la eliminación de secuencias entre las dos sondas, se pueden realizar hibridaciones adicionales con sondas seleccionadas dentro de la región que separa las dos sondas, con el fin de identificar cual porción de esta región fue eliminada.
Una vez que se localiza el punto de ruptura del evento observado con una resolución de algunos kb, un enfoque posible es diseñar cebos en ambos lados del punto de ruptura, con el fin de amplificar un fragmento que contiene el punto de ruptura mediante PCR o PCR de largo alcance, seguido por análisis de restricción y/o secuenciado y/u otras técnicas de análisis para detallar adicionalmente el rearreglo.
Se pueden extraer conclusiones sobre el efecto del rearreglo observado por el experto en la técnica mediante comparación de éste y otros rearreglos publicados en la literatura científica. Si se publica un caso no correspondiente, se puede usar la descripción fisiopatológica actual de la enfermedad de FSH D como una guía para predecir el resultado fenotípico, pero esto no debe ser usado obviamente como una conclusión definitiva de diagnóstico. 6. Aplicaciones Las aplicaciones del método descrito en la presente para evaluar el número repetido D4Z4 en cromosomas 4q y 1 0q , los haplotipos qA/qB de dichos cromosomas y variantes potencialmente estructurales de estos sitios están destinados principalmente como orientados a la investigación o como orientados a la diagnosis. 6.1 Investigación clínica Los usos de una herramienta de investigación incluyen aplicaciones tales como mecanismos fisiopatológicos de investigación involucrados en FSHD. En esta vista, se indica particularmente la descripción en casos de detalle más exactos que se consideran complejos con otras técnicas, tales como translocaciones entre cromosomas 4q y 10q, mosaicismo somático, etc. Mediante la vinculación de observaciones clínicas a esta descripción más detallada de las características moleculares de estos casos, se pueden encontrar, por ejemplo, atributos comunes de genotipos asociados con baja o alta penetración, genotipo moderado o severo, etc. La investigación de objetivos de fármaco o técnicas de terapia de genes, u otros enfoques terapéuticos puede beneficiarse de esta descripción fisiopatológica aumentada de la enfermedad .
También , mucho de lo que se describe más adelante para sistemas de diagnósticos, puede ser útil para usar la información más precisa de los aspectos genéticos de individuos proporcionada por la prueba descrita en la presente en estudios cl ínicos terapéuticos. De hecho, puede ser que algunos parámetros accesibles a través de esta prueba dicten no solamente la presencia y/o severidad de la enfermedad, sino también la respuesta a una terapia específica, o el diseño de terapias individuales (por ejemplo, terapias de genes). La identificación de tales parámetros requeriría probablemente que la prueba se realizara dentro de un estudio clínico usando técnicas convencionales para estudios farmacogenómicos.
Puesto que se ha sugerido que los aspectos epigenéticos tales como metilación CpG puede jugar un papel en la fisiopatolog ía de FSH D, es concebible también estudiar la metilación en este sitio en experimentos de Peinado Molecular. Las sondas de detección pueden acoplarse, por ejemplo, con la detección de regiones ricas en metilcitosina (metC) usando anticuerpos anti-metC y la técnica convencional para detectar sondas, o una adaptación de lo último. Puede ser necesario reducir el número de colores para permitir la detección de metC. Esto se puede hacer, por ejemplo, removiendo la sonda repetida de la hibridación, mientras que en paralelo se puede evaluar la longitud de los arreglos repetidos independientemente de la detección de metC.
Puesto que las regiones que contienen repeticiones son conocidas por tener efecto potencial sobre la replicación de ADN y puesto que ésta se puede vincular a la fisiopatología de FSH D y/o a la transmisión de la enfermedad y/o su aparición de novo en individuos, puede ser también interesante investigar la replicación de ADN en las regiones que contienen arreglos repetidos D4Z4. Esto se puede hacer esencialmente siguiendo los procedimientos descritos en Lebofsky y Bensimon , 2006. En estos procedimientos, uno o dos fluorocromos están disponibles para la detección de sondas y así el esquema de un color para sondas de ubicación , junto con la sonda repetida, puede ser detectado simultáneamente con nucleótidos incorporados durante la replicación de ADN . Alternativamente, en una muestra donde ya se ha determinado la organización física de las regiones que contienen los arreglos repetidos mediante experimentos previos, se puede omitir la sonda repetida y así pueden estar disponibles dos colores para la detección de sondas de ubicación . Los parámetros cinéticos de replicación de ADN dentro de estos sitios pueden ayudar a entender la fisiopatología de FSHD. Se pueden usar también como parámetros adicionales en estudios de diagnósticos o farmacológicos. 6.2 Diagnósticos Como una herramienta de diagnóstico, la aplicación más franca para evaluar el número de unidades repetidas usando los diseños de sonda más simples descritos, y para concluir usando el consenso científico que vincula el número de unidades repetidas en alelos 4qA con la presencia de la enfermedad . Si este es el enfoque de selección , se debe tener algún cuidado cuando se establece el umbral , es decir, la longitud del arreglo repetido (o el número de unidades repetidas) que distingue individuos sanos de individuos con FSHD. Hay de hecho alguna divergencia en la literatura en cuanto a cuál umbral usar. Por una parte, esto se puede deber a variaciones en la implementación para medir tamaños de arreglos repetidos usando métodos convencionales. Para reducir este efecto, es probablemente lo mejor calibrar el umbral usando un grupo de muestra de pacientes que fueron evaluados previamente para el número repetido usando métodos convencionales. Este grupo de muestras puede ser ensayado usando el protocolo descrito en la presente, y el factor de conversión de longitud física a número de unidades repetidas deducido de la comparación con la evaluación inicial (por ejemplo, mediante una regresión lineal , cuando se gráfica la longitud medida como una función del número estimado previamente de unidades repetidas). Entonces se puede establecer el umbral con el mismo valor del número de unidades repetidas que se usó en el diagnóstico inicial para estas muestras.
Alternativamente, si hay disponible otra técnica que carece de algunas de las ventajas de la técnica descrita en Is presente, pero tiene sus propias ventajas, se puede usar una combinación de las dos técnicas. Por ejemplo, si hay disponible una técnica económica y conveniente que tenga buena sensibilidad (es decir, muy raramente diagnostica portadores de FSHD como saludables), pero carece de especificidad (es decir, diagnostica con mucha frecuencia individuos saludables como portadores de FSHD), se puede usar como una primera clasificación de pacientes, y la técnica descrita en la presente como un control cuando se diagnostica un paciente como enfermo mediante esta primera técnica.
Realizando la prueba en la forma antes descrita , los rendimientos de la prueba serán limitados por el conocimiento disponible a través de otras técnicas. Para superar esta limitación, puede ser necesario realizar estudios clínicos con el fin de lograr una descripción potencialmente más exacta de los parámetros involucrados en el fenotipo de FSHD (saludable o portador, severidad , penetración, etc. ). Los parámetros que se pueden evaluar y comparar con producción cl ínica para encontrar los relevantes - usando técnicas convencionales para correlación estadística - incluyen: el número de unidades repetidas en alelos 4qA, la presencia de otros alelos cortos junto con un alelo corto 4qA, la presencia de alelos largos junto con un alelo corto 4qA, la presencia de motivos inesperados (cromosoma 1 0q con un haplotipo qB, espacio no canónico entre sondas de cromosoma específico y la sonda repetida , haplotipos no-qA no-qB alternativos, etc. ), la presencia de un mosaico y la fracción de células que lo portan , la presencia de inversiones dentro del arreglo repetido, inserción de secuencias no relacionadas dentro del arreglo repetido, etc.
El resultado de una prueba de diagnóstico que usa esta técnica se puede emplear por varias razones. Por una parte, en un paciente con distrofia muscular, la diagnosis molecular de FSH D puede regular una posible confusión con una distrofia similar, y/o ayudar en la selección de una terapia importante. Como se estableció antes, puede ser posible también predecir la respuesta a la terapia o para diseñar específicamente una terapia a la medida en la aplicación de los resultados de la prueba. En una aplicación de diagnóstico prenatal , puede permitir la detección temprana durante el desarrollo la presencia de la enfermedad y predecir correctamente el resultado cl ínico esperado, con el fin de que los padres tomen una decisión informada. Si las evoluciones técnicas hacen posible el uso de una técnica de estiramiento de ADN en un número muy limitado de células (1 -2 células), esta prueba puede usarse también para pre-implantación de diagnósticos. En una aplicación de orientación genética, la evaluación correcta de los aspectos genéticos para padres debe permitir la predicción correcta de la probabilidad de transmitir la enfermedad , especialmente si se puede determinar la fracción de un alelo de mosaico, así como también la penetración de un alelo dado.
REFERENCIAS Berlemont, S. y Bensimon, A. y Olivo-Marín, J.-C (2007). "Feature-Adapted Fast Slant Stack", IEEE International Conference on Image Processing; vol.4:57-60. Sept.2007 Berlemont, S. y Bensimon, A. y Olivo-Marin, J.-C (2007a). "Detection of Curvilinear Objects in Noisy Image using Feature-Adapted Beamlet Transform", IEEE International Conference on Acoustic, Speech and Signal Processing. Apr.2007 Berlemont, S. y Bensimon, A. y Olivo-Marin, J.-C (2007b). "Detection of Linear Structures in Biological Images", Asilomar Conference on Signáis, Systems, and Computers. Nov.2007 Berlemont, S. y Bensimon, A. y Olivo-Marin, J.-C. (2007c). "Detection of Curvilinear objects in Biological Noisy Image using Feature-Adapted Fast Slant Stack", SPIE conference Wavelets XII, Special Session on Wavelet in Bioimaging. Aug.2007 Cacurri S, Piazzo N, Deidda G, Vigneti E, Galluzzi G, Colantoni L, Merico B, Ricci E, Felicetti L (1998). "Sequence homology between 4qter and 10qter loci facilitates the instability of subtelomeric Kpnl repeat units implicated in facioscapulohumeral muscular dystrophy." Am J Hum Genet.; 63(1):181 -90.
Conti C, Caburet S, Schurra C, Bensimon A (2001). "Molecular combing", Curr Protoc Cytom.; Chapter 8:Unit 8.10.
Deak KL, Lemmers RJ, Stajich JM, Klooster R, Tawil R, Frants RR, Speer MC, van der Maarel S , Gilbert JR (2007). "Genotype-phenotype study in an FSHD family with a proximal deletion encompassing p1 3E-1 1 and D4Z4." Neurology; 68(8):578-82.
Dimalanta ET, Lim A, Runnheim R, Lamers C, Churas C, Forrest DK, de Pablo JJ , Graham M D, Coppersmith SN , Goldstein S , Schwartz DC (2004). "A microfluidic system for large DNA molecule arrays." Anal Chem. 2004 Sep 1 5;76( 18):5293-301 .
Ehrlich M , Jackson K, Tsumagari K, Carnario P, Lemmers RJ (2007). "Hybridization analysis of D4Z4 repeat arrays linked to FSHD." Chromosoma . ; 1 16(2): 107-1 6.
Florijn RJ, Bonden LA, Vrolijk H , Wiegant J , Vaandrager JW, Baas F, den Dunnen JT, Tanke HJ , van Ommen GJ , Raap AK ( 1995). "High-resolution DNA Fiber-FISH for genomic DNA mapping and colour bar-coding of large genes." Hum Mol Genet. 1 995 May;4(5):831 -6.
Fransz PF, Alonso-Blanco C, Liharska TB , Peeters AJ , Zabel P, de Jong JH ( 1996). "High-resolution physical mapping in Arabidopsis thaliana and tomato by fluorescence in situ hybridization to extended DNA fibres." Plant J . 1 996 Mar;9(3):421 -30.
Gad S, Aurias A, Puget N , Mairal A, Schurra C, Montagna M , Pages S, Caux V, Mazoyer S, Bensimon A, Stoppa-Lyonnet D (2001 ). "Color bar coding the BRCA1 gene on combed DNA: a useful strategy for detecting large gene rearrangements." Genes Chromosomes Cáncer. ; 31 ( 1 ):75-84.
Goto K, Nishino I , Hayashi YK (2006). "Rapid and accurate diagnosis of facioscapulohumeral muscular dystrophy." Neuromuscul Disord.; 16(4):256-61.
Haaf T, Ward DC (1994)."Structural analysis of alpha-satellite DNA and centromere proteins using extended chromatin and chromosomes." Hum Mol Genet.1994 May;3(5):697-709.
Heiskanen M, Kallioniemi O, Palotie A (1996). "Fiber-FISH: experiences and a refined protocol." Genet Anal. 1996 Mar; 12(5-6): 179-84.
Heiskanen M, Karhu R, Hellsten E, Peltonen L, Kallioniemi OP, Palotie A (1994). "High resolution mapping using fluorescence in situ hybridization to extended DNA fibers prepared from agarose-embedded cells." Biotechniques. 1994 Nov; 17(5):928-9, 932-3.
Heng HH, Squire J, Tsui LC (1992). "High-resolution mapping of mammalian genes by in situ hybridization to free chromatin." Proc Nati Acad Sci U S A. 1992 Oct 15;89(20):9509-13.
Herrick J, Michalet X, Conti C, Schurra C, Bensimon A (2000).
"Quantifying single gene copy number by measuring fluorescent probe lengths on combed genomic DNA." Proc Nati Acad Sci U S A.; 97(1):222-7. Erratum in: Proc Nati Acad Sci U S A.; 97(8):4410.
Hewitt JE, Lyle R, Clark LN, Valleley EM, Wright TJ, Wijmenga C, van Deutekom JC, Francis F, Sharpe PT, Hofker M, et al (1994).
"Analysis of the tándem repeat locus D4Z4 associated with facioscapulohumeral muscular dystrophy." Hum Mol Genet.; 3(8): 1287- 95.
Jing J, Reed J, Huang J, Hu X, Clarke V, Edington J, Housman D, Anantharaman TS, Huff EJ, Mishra B, Porter B, Shenker A, Wolfson E, Hiort C, Kantor R, Aston C, Schwartz DC (1998). "Automated high resolution optical mapping using arrayed, fluid-fixed DNA molecules." Proc Nati Acad Sc¡ U S A. 1998 Jul 7;95(14):8046-51.
Kekou K, Fryssira H, Sophocleous C, Mavrou A, Manta P, Metaxotou C (2005). "Facioscapulohumeral muscular dystrophy molecular testing using a non radioactive protocol." Mol Cell Probes.; 19(6):422-4.
Larson JW, Yantz GR, Zhong Q, Chamas R, D'Antoni CM, Gallo MV, GilHs KA, Neely LA, Phillips KM, Wong GG, Gullans SR, Gilmanshin R (2006). "Single DNA molecule stretching in sudden mixed shear and elongational microflows." Lab Chip. 2006 Sep;6(9):1187-99.
Epub 2006 Jul 7.
Lebofsky R, Bensimon A (2005). "DNA replication origin plasticity and perturbed fork progression in human inverted repeats." Mol Cell Biol.; 25(15):6789-97.
Lebofsky R, Bensimon A, (2006). "Fluorescent Visualization of Genomic Structure and DNA replication at the Single Molecule Level." in "Cell Biology, a Laboratory Handbook", 3a Ed., Vol. 3, capítulo 45 ; Elsevier Academic Press, 2006 Lebofsky R, Heilig R, Sonnleitner M, Weissenbach J, Bensimon A (2006). "DNA replication origin interference increases the spacing between initiation events in human cells." Mol Biol Cell.; 17(12):5337- 45.
Lemmers RJ, Wohlgemuth M, van der Gaag KJ, van der Vliet PJ, van Teijlingen CM, de Knijff P, Padberg GW, Frants RR, van der Maarel SM (2007). "Specific sequence variations within the 4q35 región are associated with facioscapulohumeral muscular dystrophy." Am J Hum Genet.; 81 (5):884-94.
Lemmers RJ, van der Wielen MJ, Bakker E, Frants RR, van der Maarel SM (2006). "Rapid and accurate diagnosis of facioscapulohumeral muscular dystrophy." Neuromuscul Disord.; 16(9-10):615-7.
Lemmers RJ, Osborn M, Haaf T, Rogers M, Frants RR, Padberg GW, Cooper DN, van der Maarel SM, Upadhyaya M (2003). "D4F104S1 deletion in facioscapulohumeral muscular dystrophy: phenotype, size, and detection." Neurology.; 61 (2):178-83.
Lemmers RJ, de Kievit P, Sandkuijl L, Padberg GW, van Ommen GJ, Frants RR, van der Maarel SM (2002). "Facioscapulohumeral muscular dystrophy is uniquely associated with one of the two variants of the 4q subtelomere." Nat Genet.; 32(2):235-6.
Lemmers RJ, van der Maarel SM, van Deutekom JC, van der Wielen MJ, Deidda G, Dauwerse HG, Hewitt J, Hofker M, Bakker E, Padberg GW, Frants RR (1998). "Inter- and intrachromosomal sub-telomeric rearrangements on 4q35: implications for facioscapulohumeral muscular dystrophy (FSHD) aetiology and diagnosis." Hum Mol Genet.; 7(8):1207-14.
Mann SM, Burkin DJ, Grin DK, Ferguson-Smith MA (1997). "A fast, novel approach for DNA fibre-fluorescence in situ hybridization analysis." Chromosome Res. 1997 Apr;5(2): 145-7.
Michalet X, Ekong R, Fougerousse F, Rousseaux S, Schurra C, Hornigold N, van Slegtenhorst M, Wolfe J, Povey S, Beckmann JS, Bensimon A (1997). "Dynamic molecular combing: stretching the whole human genome for high-resolution studies." Science.; 277(5331): 1518-23.
Palotie A, Heiskanen M, Laan M, Horelli-Kuitunen N (1996).
"High-resolution fluorescence in situ hybridization: a new approach in genome mapping." Ann Med. 1996 Apr;28(2):101-6.
Parra I, Windle B (1993). "High resolution visual mapping of stretched DNA by fluorescent hybridization." Nat Genet. 1993 Sep;5(1):17-21.
Raap AK (1998). "Advances in fluorescence in situ hybridization." Mutat Res. 1998 May 25;400(1 -2):287-98.
Samad A, Huff EF, Cai W, Schwartz DC (1995). Optical mapping: a novel, single-molecule approach to genomic analysis." Genome Res. 1995 Aug;5(1):1 -4.
Schwartz DC, Li X, Hernández Ll, Ramnarain SP, Huff EJ, Wang YK (1996). "Ordered restriction maps of Saccharomyces cerevisiae chromosomes constructed by optical mapping." Science. 1993 Oct 1; 262(5130):110-4.
Tupler R, Barbierato L, Memmi M, Sewry CA, De Grandis D, Maraschio P, Tiepolo L, Ferlini A (1998). "Identical de novo mutation at the D4F104S1 locus in monozygotic male twins affected by facioscapulohumeral muscular dystrophy (FSHD) with different clinical expression." J Med Genet.; 35(9):778-83.
Van der Maarel SM, Frants RR, Padberg GW (2007).
"Facioscapulohumeral muscular dystrophy." Biochim Biophys Acta.; 1772(2): 186-94.
Van der Maarel SM, Deidda G, Lemmers RJ, van Overveld PG, van der Wielen M, Hewitt JE, Sandkuijl L, Bakker B, van Ommen GJ, Padberg GW, Frants RR (2000). "De novo facioscapulohumeral muscular dystrophy: frequent somatic mosaicism, sex-dependent phenotype, and the role of mitotic transchromosomal repeat interaction between chromosomes 4 and 10." Am J Hum Genet; 66(1 ):26-35.
Van Deutekom JC, Wijmenga C, van Tienhoven EA, Gruter AM, Hewitt JE, Padberg GW, van Ommen GJ, Hofker MH, Frants RR (1993). "FSHD associated DNA rearrangements are due to deletions of integral copies of a 3.2 kb tandemly repeated unit." Hum Mol Genet.; 2(12):2037-42.
Van Geel M, Dickson MC, Beck AF, Bolland DJ, Frants RR, van der Maarel SM, de Jong PJ, Hewitt JE (2002). "Genomic analysis of human chromosome 10q and 4q telomeres suggests a common origin." Genomics.; 79(2):210-7.
Vaandrager JW, Schuuring E, Kluin-Nelemans HC, Dyer MJ, Raap AK, Kluin PM (1996). "DNA fiber fluorescence in situ hybridization analysis of immunoglobulin class switching in B-cell neoplasia: aberrant CH gene rearrangements in follicle center-cell lymphoma." Blood. 1998 Oct 15;92(8):2871-8.
Wiegant J, Kalle W, Mullenders L, Brookes S, Hoovers JM, Dauwerse JG, van Ommen GJ, Raap AK (1996). "High-resolution in situ hybridization using DNA halo preparations." Hum Mol Genet. 1992 Nov; 1 (8):587-91.
Windle B, Silvas E, Parra I (1996). "High resolution microscopic mapping of DNA using multi-color fluorescent hybridization." Electrophoresis. 1995 Feb; 16(2):273-8.

Claims (16)

REIVINDICACIONES
1 . Un método para analizar in vitro arreglos repetidos en tándem D4Z4 contenidos en ácido nucleico representativo de cromosomas, en particular para determinar el número de unidades repetidas D4Z4 en dichos arreglos repetidos D4Z4, dicho método que comprende un paso de hibridación de ácido nucleico representativo de dichos cromosomas con por lo menos las siguientes sondas: - Una sonda o un conjunto de sondas denominadas "sonda(s) repetida(s)", que es (son) específica(s) para arreglos repetidos D4Z4; - Una sonda o uno o varios conjuntos de sondas que permiten distinguir el cromosoma 4 (4q) del cromosoma 1 0 ( 1 0q); y - Una sonda o uno o varios conjuntos de sondas que permiten distinguir el haplotipo qA del haplotipo qB, y - Opcionalmente, una sonda o uno o varios conjuntos de sondas que permiten distinguir el cromosoma Y del cromosoma 4 y/o del cromosoma 1 0, en donde dichas sondas están etiquetadas de preferencia, ya sea todas las sondas están etiquetadas con la(s) misma(s) etiqueta(s) o por lo menos una sonda, por ejemplo por lo menos una sonda repetida , que está etiquetada con una o varias etiquetas diferentes de la(s) etiqueta(s) de otras sondas.
2. El método de acuerdo con la reivindicación 1 , que comprende o que consiste de los siguientes pasos: a) proporcionar un soporte en el cual una muestra de ácido nucleico que comprende ácido nucleico representativo de cromosomas se ha estirado previamente en hebras lineales y paralelas e hibridar dicho ácido nucleico con las sondas; b) detectar las señales de hibridación que corresponden a las sondas; y c) analizar la organización de arreglos repetidos D4Z4 en ácido nucleico representativo de cromosomas, en particular: - determinar el número de unidades repetidas D4Z4 en dichos arreglos repetidos D4Z4, y/o - determinar la orientación de las unidades repetidas D4Z4 en dicha repetición D4Z4; y/o - detectar y/o analizar rearreglos y/o analizar la metilación , en particular metilación CpG y/o analizar eventos bioquímicos, en particular replicación y/o transcripción y/o factor de transcripción aglutinante y/o unión de otras proteínas de unión de ADN en dichos arreglos repetidos D4Z4 y/o en regiones adyacentes o esencialmente adyacentes a dichos arreglos repetidos D4Z4.
3. El método de acuerdo con la reivindicación 2, en donde el paso de hibridación con las sondas se realiza antes y/o después de estirar la muestra de ácido nucleico en el soporte, dicho paso de hibridación que es, si se necesita, precedido por un paso de desnaturalización de dicha muestra de ácido nucleico y/o de las sondas.
4. El método de acuerdo con la reivindicación 2 o 3, en donde el paso b) incluye además obtener, para cada ácido nucleico que muestra por lo menos una señal de hibridación que corresponde a una sonda repetida, información correspondiente a una o una combinación de las siguientes categorías: (1 ) tipificar las señales de hibridación , (2) la longitud de una o varias señales de hibridación, (3) la posición de una o varias señales de hibridación con relación a un arreglo repetido D4Z4, y (4) la distancia entre dos señales de hibridación , en particular entre dos señales consecutivas de hibridación .
5. El método de acuerdo con cualquiera de las reivindicaciones 2 a 4, en donde el paso b) incluye además (i) medir la longitud de cada señal de hibridación que corresponde a una sonda repetida y/o medir, para cada arreglo repetido D4Z4 detectado, la distancia entre la primera señal de hibridación que corresponde a una sonda repetida y la última señal de hibridación que corresponde a una sonda repetida en la misma hebra de ácido nucleico, y de preferencia (ii ) establecer un histograma de las longitudes o distancias medidas.
6. El método de acuerdo con cualquiera de las reivindicaciones 2 a 5, en donde la muestra de ácido nucleico se ha estirado en el soporte usando una técnica de peinado molecular.
7. El método de acuerdo con cualquiera de las reivindicaciones 1 a 6, en donde (i) la sonda o conjunto(s) de sondas que permite(n ) distinguir el cromosoma 4 del cromosoma 1 0 comprende o consiste de: - (i) una sonda que es específica para el cromosoma 4 o (ii) una sonda o uno o varios conjuntos de sondas que hibridan con el cromosoma 4, dicha sonda o cada uno de dichos conjuntos de sondas que se seleccionan de tal manera que por hibridación con el cromosoma 4, la posición de las sondas, una en comparación con las otras, forma una firma que es específica para el cromosoma 4. - (i) una sonda que es específica para el cromosoma 1 0 o (¡i ) una sonda o uno o varios conjuntos de sondas que hibridan con el cromosoma 1 0, dicha sonda o cada uno de dichos conjuntos de sondas que se seleccionan de tal manera que por hibridación con el cromosoma 1 0, la posición de las sondas, una en comparación con las otras, forma una firma que es específica para el cromosoma 1 0. (ii) la sonda o conjunto(s) de sondas que permite(n) distinguir el haplotipo qA del haplotipo qB comprende(n) o consiste(n) de: - (i) una sonda que es específica para el haplotipo qA o (ii) una sonda o uno o varios conjuntos de sondas que hibridan con los cromosomas del haplotipo qA, dicha sonda o cada uno de dichos conjuntos de sondas que se seleccionan de tal manera que por hibridación con dichos cromosomas, la posición de las sondas, una en comparación con las otras, forma una firma que es específica para el haplotipo qA; y/o - (i ) una sonda que específica para el haplotipo qB o (ii) una sonda o uno o varios conjuntos de sondas que hibridan con los cromosomas del haplotipo qB , dicha sonda o cada uno de dichos conjuntos de sondas que se seleccionan de tal manera que por hibridación con dichos cromosomas, la posición de las sondas, una en comparación con las otras, forma una firma que es específica para el haplotipo qB; y/o (iii) si cualquiera, la sonda o conjunto(s) de sondas que permite(n) distinguir el cromosoma Y del cromosoma 4 y/o del cromosoma 1 0 comprende(n) o consiste(n) de (i) una sonda que es específica para el cromosoma Y o (ii) una sonda o uno o varios conjuntos de sondas que hibridan con el cromosoma Y, dicha sonda o cada uno de dichos conjuntos de sondas que se seleccionan de tal manera que por hibridación con el cromosoma Y, la posición de las sondas, una en comparación con las otras, forma una firma que es específica para el cromosoma Y.
8. El método de acuerdo con la reivindicación 7 , en donde 1 ) la sonda que es específica para cualquiera el cromosoma 4 o el cromosoma 10, la sonda que forma una firma específica para cualquiera, el cromosoma 4 o el cromosoma 10, o por lo menos una sonda del conjunto de sondas que forma una firma específica para cualquiera el cromosoma 4 o el cromosoma 1 0, híbrida con una región del brazo largo de cualquiera del cromosoma 4 o el cromosoma 10 respectivamente, dicha región es centromérica con relación al arreglo repetido D4Z4, por ejemplo respectivamente (i) la región del brazo largo del cromosoma 4 que está ubicado por lo menos a 4 kb, de preferencia por lo menos a 65 kb y más preferiblemente por lo menos a 65 kb y cuando mucho a 1 00 kb corriente arriba del extremo centromérico del arreglo repetido D4Z4 o (ii) la región del brazo largo del cromosoma 1 0 que está ubicada por lo menos a 42 kb, de preferencia por lo menos 42 kb y cuando mucho a 75 kb corriente arriba del extremo centromérico del arreglo repetido D4Z4 y/o 2) la sonda que es específica para el haplotipo qA o qB, la sonda que forma una firma específica para el haplotipo qA o qB o por lo menos una sonda del conjunto de sondas que forma una firma específica para el haplotipo qA o qB híbrida con una región del brazo largo del cromosoma 4qA o 4qB respectivamente que es telomérica, en particular inmediatamente telomérica, con relación al arreglo repetido D4Z4.
9. El método de acuerdo con la reivindicación 7 u 8, en donde (i) la sonda que es específica para el haplotipo qA, la sonda que forma una firma específica para el haplotipo qA o por lo menos una sonda del conjunto de sondas que forma una firma específica para el haplotipo qA híbrida con - el arreglo repetido de una secuencia beta-satélite de 68 bp que es inmediatamente telomérica con relación al arreglo repetido D4Z4 en el brazo largo del cromosoma 4qA o con una porción de esta secuencia beta-satélite; y/o - el arreglo repetido de aproximadamente 1 kb de unidades repetidas (TTAGGG)n que es inmediatamente telomérico con relación a dicho arreglo repetido de una secuencia beta-satélite en el brazo largo del cromosoma 4qA o con una porción de esta región de aproximadamente 1 kb; o - la región de aproximadamente 750 bp que está ubicada aproximadamente a 2.5 kb corriente abajo del extremo telomérico de dicho arreglo repetido de una secuencia beta-satélite en el brazo largo del cromosoma 4qA o con una porción de esta región de aproximadamente 750 bp; o - la región de aproximadamente 1 3 kb que está ubicada por lo menos a aproximadamente 8.5 kb corriente abajo del extremo telomérico de dicho arreglo repetido de una secuencia beta-satélite en el brazo largo del cromosoma 4qA; y/o (ii) la sonda que es específica para el haplotipo qB, la sonda que forma una firma específica para el haplotipo qB o por lo menos una sonda de conjunto de sondas que forma una firma específica para el haplotipo qB híbrida con la totalidad de la región de aproximadamente 6 kb que es inmediatamente telomérica con relación al arreglo repetido D4Z4 en el brazo largo del cromosoma 4qB o con una porción de esta región, dicha porción que comprende por lo menos 2 kb, de preferencia por lo menos 3 o 4 kb, y más preferiblemente por lo menos 5 kb de esta región .
1 0. El método de acuerdo con cualquiera de las reivindicaciones 7 a 9, en donde la sonda repetida o por lo menos una de las sondas repetidas híbrida, de preferencia a lo largo de su longitud entera, con la secuencia entera de la unidad repetida D4Z4 o un arreglo repetido D4Z4 o con una porción de la unidad repetida D4Z4 o un arreglo repetido D4Z4, en particular una porción que consiste de aproximadamente una mitad de dicha unidad repetida D4Z4 o una porción ubicada en un extremo de dicha unidad repetida D4Z4 o cerca a un extremo de dicha unidad repetida D4Z4.
1 1 . El método de acuerdo con cualquiera de las reivindicaciones 7 a 10, en donde - la sonda que es específica para el cromosoma 4, la sonda que forma una firma específica para el cromosoma 4 o un conjunto de sondas que forma una firma específica para el cromosoma 4, comprende o consiste de una o varias sondas que comprenden o consisten de: i) una secuencia seleccionada entre secuencias que fluctúan a partir de las siguientes coordenadas con relación a la secuencia de referencia NCBI construcción 36.1 Humana: 191089412 a 191096843 (sonda 4q1), 191106888 a 191116775 (sonda 4q2), 191128570 a 191138567 (sonda 4q3) y 191148576 a 191158554 (sonda 4q4); ii) una secuencia complementaria a la secuencia i); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii) bajo condiciones astringentes; iv) una variante de nucleótido de la secuencia i), o v) una porción de cualquiera de las secuencias (i), (ii), (iii) o (iv), y/o - la sonda que es específica para el cromosoma 10, la sonda que forma una firma específica para el cromosoma 10 o un conjunto de sondas que forma una firma específica para el cromosoma 10 comprende o consiste de una o varias sondas que comprenden o consisten de: i) una secuencia seleccionada entre secuencias que fluctúan desde las siguientes coordenadas con relación a la secuencia de referencia NCBI construcción 36.1 Humana: 135247926 a 135252909 (sonda 10q1), 135257958 a 135262966 (sonda 10q2), 135267992 a 135272976 (sonda 10q3) y 135278058 a 135282988 (sonda 10q4); ii) una secuencia complementaria a la secuencia i); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii) bajo condiciones astringentes; iv) una variante de nucleótido de la secuencia i); o v) una porción de cualquiera de las secuencias (i), (ii), (iii) o (iv), y/o - la sonda que es específica para el haplotipo qA, la sonda que forma una firma específica para el haplotipo qA o un conjunto de sondas que forma una firma específica para el haplotipo qA comprende o consiste de una o varias sondas que comprenden o consisten de: i) una secuencia seleccionada entre secuencias que fluctúan desde las siguientes coordenadas con relación al número de acceso U74496.1 de Genbank: 2756 a 3556 (sonda qA1 ) y 8723 a 10672 (sonda qA2); ii) una secuencia complementaria a la secuencia i); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii) bajo condiciones astringentes; iv) una variante de nucleótido de la secuencia i); o v) una porción de cualquiera de las secuencias (i), (ii), (iii) o (iv), y/o - la sonda que es específica para el haplotipo qB, la sonda que forma una firma específica para el haplotipo qB o por lo menos una sonda del conjunto de sondas que forma una firma específica para el haplotipo qB comprende o consiste de: i) una secuencia que fluctúa desde las siguientes coordenadas con relación a la secuencia de referencia NCBI construcción 36.1 Humana: 191252023 a 191253372 (sonda qB1-3) y 191248879 a191252040 (sonda qB1-4), o la única sonda formada de qB1-3 y qB1-4 que resulta en qB1 ; ii) una secuencia complementaria a la secuencia i); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii) bajo condiciones astringentes; iv) una variante de nucleótido de la secuencia i); o v) una porción de cualquiera de las secuencias (i), (ii), (iii) o (iv), y/o - la sonda repetida o por lo menos una de las sondas repetidas consiste de: i) una secuencia seleccionada entre secuencias que fluctúan a partir de las siguientes coordenadas con relación al número de acceso U85056.1 de Genbank: 24213 a 27507 (sonda DeeZee), 24213 a 25948 (sonda Dee) y 25763 a 27507 (sonda Zee); ii) una secuencia complementaria a la secuencia i); iii) una secuencia capaz de hibridar con la secuencia (i) o (ii) bajo condiciones astringentes; iv) una variante de nucleótido de la secuencia i); o v) una porción de cualquiera de las secuencias (i), (ii), (iii) o (iv).
12. El método de acuerdo con la reivindicación 10 u 11, en donde la sonda repetida o por lo menos una de las sondas repetidas híbrida, a lo largo de su longitud entera, con la secuencia completa de la unidad repetida D4Z4 de un arreglo repetido D4Z4, y en donde el número de unidades repetidas en un arreglo repetido D4Z4 se determina mediante: 1 ) medir, para este arreglo repetido, la longitud total (L) de la señal de hibridación que corresponde a las sondas repetidas de hibridación; y 2) calcular el número (n) de unidades repetidas D4Z4 de dichas unidades repetidas D4Z4 usando la relación n = M , en donde I corresponde a la longitud de una unidad repetida D4Z4.
1 3. El método de acuerdo con cualquiera de las reivindicaciones 1 a 12 , en donde se usan por lo menos dos sondas repetidas diferentes, en donde (i) dichas sondas repetidas hibridan con regiones distintas de la unidad repetida D4Z4 en un arreglo repetido D4D4 y/o (ii) una de dichas sondas híbrida con una región de la unidad repetida D4Z4 la cual se incluye, totalmente o en parte, en la región de la unidad repetida D4Z4 que híbrida con otra de dichas sondas y en donde estas sondas repetidas son de preferencia de tamaño diferente y/o etiquetada con por lo menos una etiqueta diferente.
14. El método de acuerdo con cualquiera de las reivindicaciones 1 a 1 3, en donde la muestra de ácido nucleico usada para estiramiento es ADN , de preferencia ADN genómico y más preferiblemente ADN genómico nuclear.
1 5. El método de acuerdo con cualquiera de las reivindicaciones 1 a 14, que incluye además hibrídar la muestra de ácido nucleico con una o varias de las siguientes sondas, las cuales están etiquetadas de preferencia: - una sonda o un conjunto de sondas que híbrida con la región de aproximadamente 42 kb que está inmediatamente centromérica con relación al arreglo repetido D4Z4 en el brazo largo del cromosoma 4 o con una porción de esta región y/o que híbrida con la región de aproximadamente 42 kb que está inmediatamente centromérica con relación al arreglo repetido D4Z4 en el brazo largo del cromosoma 1 0 o con una porción de esta región; y/o - una sonda o conjunto de sondas que híbrida con la región de aproximadamente 1 5 kb que está inmediatamente telomérica con relación al arreglo repetido D4Z4 en cromosomas del haplotipo qA y/o en cromosomas del haplotipo qB o con una porción de esta región .
16. Un método para analizar arreglos repetidos en tándem D4Z4 de ácido nucleico y en particular para determinar el número de unidades repetidas D4Z4 en dichos arreglos repetidos en tándem D4Z4, dicho método que comprende realizar el método de acuerdo con cualquiera de las reivindicaciones 2 a 1 5, en donde el paso c) incluye además determinar, para cada arreglo repetido D4Z4 detectado, - si dicho arreglo repetido está ubicado en un cromosoma del haplotipo qA y en particular en un cromosoma 4, y - opcionalmente si dicho arreglo repetido está ubicado en un cromosoma del haplotipo qB; y - opcionalmente, si dicho arreglo repetido está ubicado en un cromosoma 1 0; y - opcionalmente, si dicho arreglo repetido está ubicado en un cromosoma Y. 1 7. Un método para detectar in vitro la susceptibilidad de distrofia muscular facioscapulohumeral (FSH D) en un paciente, dicho método que comprende o que consiste en analizar mediante el método de acuerdo con cualquiera de las reivindicaciones 1 a 16, arreglos repetidos en tándem D4Z4 contenidos en una muestra de ADN genómico obtenida de dicho paciente, en particular determinar el número de unidades repetidas D4Z4 en el arreglo repetido D4Z4 de cada alelo 4qA detectado en dicha muestra de ADN genómico. 1 8. Un método para identificar eventos bioquímicos y/o parámetros genéticos y epigenéticos involucrados en el fenotipo de distrofia muscular facioscapulohumeral (FSHD), dicho método que comprende analizar, mediante el método de acuerdo con las reivindicaciones 1 a 1 6, arreglos repetidos D4Z4 contenidos en ácido nucleico representativo de cromosomas obtenido de dichos pacientes, en particular en ácido nucleico de cromosomas 4, y opcionalmente 10 y/o Y, dicho análisis que se realiza independientemente para cada paciente. 1 9. Un paquete caracterizado porque comprende o consiste de por lo menos: - una sonda repetida o un conjunto de sondas repetidas; - una sonda o uno o varios conjuntos de sondas que permite distinguir el cromosoma 4 del cromosoma 1 0; y - una sonda o uno o varios conjuntos de sondas que permite distinguir el haplotipo qA del haplotipo qB ; y - opcionalmente, una sonda o uno o varios conjuntos de sondas que permite(n) distinguir el cromosoma Y del cromosoma 4 y/o del cromosoma 10; dichas sondas que son como se definen en cualquiera de las reivindicaciones 1, 7 a 11 y 13, y dichas sondas que están etiquetadas o destinadas a ser etiquetadas.
MX2011003170A 2008-09-26 2009-09-25 Metodo para analizar conjuntos de secuencias repetidas en tandem d4z4 de acido nucleico y paquete correspondiente. MX339866B (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP08165310.7A EP2175037B1 (en) 2008-09-26 2008-09-26 Method for analyzing D4Z4 tandem repeat arrays of nucleic acid and kit therefore
PCT/IB2009/007197 WO2010035140A1 (en) 2008-09-26 2009-09-25 Method for analyzing d4z4 tandem repeat arrays of nucleic acid and kit therefore

Publications (2)

Publication Number Publication Date
MX2011003170A true MX2011003170A (es) 2011-11-01
MX339866B MX339866B (es) 2016-06-14

Family

ID=40279124

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2011003170A MX339866B (es) 2008-09-26 2009-09-25 Metodo para analizar conjuntos de secuencias repetidas en tandem d4z4 de acido nucleico y paquete correspondiente.

Country Status (4)

Country Link
US (1) US9422607B2 (es)
EP (1) EP2175037B1 (es)
MX (1) MX339866B (es)
WO (1) WO2010035140A1 (es)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2175037B1 (en) 2008-09-26 2017-10-11 Genomic Vision Method for analyzing D4Z4 tandem repeat arrays of nucleic acid and kit therefore
CN105734170A (zh) 2010-04-23 2016-07-06 基因组影像公司 通过由分子梳检测基因组和感染性病毒dna的病毒感染的诊断
EP4050109A1 (en) * 2010-08-18 2022-08-31 Fred Hutchinson Cancer Center Agents for use in treating facioscapulohumeral dystrophy (fshd)
WO2013120038A2 (en) * 2012-02-10 2013-08-15 Regents Of The University Of Minnesota Morpholino targeting dux4 for treating fshd
WO2013192185A1 (en) * 2012-06-18 2013-12-27 Fred Hutchinson Cancer Research Center Methods compositions related to the smchd1 gene
WO2016057648A1 (en) * 2014-10-09 2016-04-14 University Of Massachusetts Medical Center Molecular diagnosis of fshd by epigenetic signature
EP3497239A4 (en) * 2016-08-10 2020-02-26 Ramot at Tel-Aviv University Ltd. METHYLATION STATUS ANALYSIS AND COPY NUMBER
EP3541955A1 (en) 2016-11-15 2019-09-25 Genomic Vision Method for the monitoring of modified nucleases induced-gene editing events by molecular combing
CN110199031A (zh) 2016-11-29 2019-09-03 基因组影像公司 设计用于分析感兴趣的遗传区域中的特定事件的一组多核苷酸序列的方法
AU2019249422A1 (en) * 2018-04-02 2020-10-15 Grail, Llc Methylation markers and targeted methylation probe panels
CA3111887A1 (en) 2018-09-27 2020-04-02 Grail, Inc. Methylation markers and targeted methylation probe panel
US20230220473A1 (en) * 2020-05-29 2023-07-13 Children's National Medical Center Genetic diagnostic tool for facioscapulohumeral muscular dystrophy (fshd)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2716263B1 (fr) 1994-02-11 1997-01-17 Pasteur Institut Procédé d'alignement de macromolécules par passage d'un ménisque et applications dans un procédé de mise en évidence, séparation et/ou dosage d'une macromolécule dans un échantillon.
FR2737574B1 (fr) 1995-08-03 1997-10-24 Pasteur Institut Appareillage d'alignement parallele de macromolecules et utilisation
FR2755149B1 (fr) 1996-10-30 1999-01-15 Pasteur Institut Procede de diagnostic de maladies genetiques par peignage moleculaire et coffret de diagnostic
US6248537B1 (en) 1999-05-28 2001-06-19 Institut Pasteur Use of the combing process for the identification of DNA origins of replication
US20050054012A1 (en) * 2002-10-11 2005-03-10 Tupler Rossella G. Methods of detecting and treating facioscapulohumeral muscular dystrophy
US7985542B2 (en) 2006-09-07 2011-07-26 Institut Pasteur Genomic morse code
EP2175037B1 (en) 2008-09-26 2017-10-11 Genomic Vision Method for analyzing D4Z4 tandem repeat arrays of nucleic acid and kit therefore

Also Published As

Publication number Publication date
US20130130924A1 (en) 2013-05-23
EP2175037A1 (en) 2010-04-14
WO2010035140A8 (en) 2010-08-05
US9422607B2 (en) 2016-08-23
MX339866B (es) 2016-06-14
WO2010035140A1 (en) 2010-04-01
EP2175037B1 (en) 2017-10-11

Similar Documents

Publication Publication Date Title
US9422607B2 (en) Method for analyzing D4Z4 tandem repeat arrays of nucleic acid and kit therefore
US5545527A (en) Method for testing for mutations in DNA from a patient sample
DK2529032T3 (en) METHODS AND COMPOSITIONS FOR NON-INVASIVE PRE-NATIONAL DIAGNOSTICATION OF Fetal ANEUPLOIDITIES
TWI236502B (en) Prediction of inflammatory disease
US7303880B2 (en) Microdissection-based methods for determining genomic features of single chromosomes
Stence et al. Validation of optical genome mapping for the molecular diagnosis of facioscapulohumeral muscular dystrophy
JP6622731B2 (ja) 歯周病の重症度および進行を決定するための改良された方法およびキット
US20110312534A1 (en) Method for prediction of human iris color
WO2017004189A1 (en) Single nucleotide polymorphism in hla-b*15:02 and use thereof
US6403303B1 (en) Method and reagents for testing for mutations in the BRCA1 gene
US20160040220A1 (en) Methods for the detection of breakpoints in rearranged genomic sequences
US20130130246A1 (en) Methods for the detection, visualization and high resolution physical mapping of genomic rearrangements in breast and ovarian cancer genes and loci brca1 and brca2 using genomic morse code in conjunction with molecular combing
Moutereau et al. An improved electronic microarray‐based diagnostic assay for identification of MEFV mutations
US10036071B2 (en) Methods for the detection of sequence amplification in the BRCA1 locus
Amvrosiadou et al. Multi-allele genotyping platform for the simultaneous detection of mutations in the Wilson disease related ATP7B gene
AU2005228209A1 (en) Computational selection of probes for localizing chromosome breakpoints
WO2010044459A1 (ja) 緑内障のリスクの予測方法
US20030144799A1 (en) Regulatory single nucleotide polymorphisms and methods therefor
Bruins Telomere biology related disorders and cancer: towards implementation of telomere length measurement assays
KR20230037111A (ko) 대사증후군 특이적 후성유전 메틸화 마커 및 이의 용도
WO2010047240A1 (ja) 滲出型加齢黄斑変性のリスクの予測方法
Fish Analysis of genetic variations associated with arrhythmogenic right ventricular cardiomyopathy
KR101513276B1 (ko) 변형 mlpa 를 이용한 카피 수 다형성의 다중 분석 방법
Al-Saud The genetics of obesity in Saudi Arabian population

Legal Events

Date Code Title Description
FG Grant or registration