ES2337207T3 - Procedimiento para determinar el numero de copias. - Google Patents

Procedimiento para determinar el numero de copias. Download PDF

Info

Publication number
ES2337207T3
ES2337207T3 ES07732383T ES07732383T ES2337207T3 ES 2337207 T3 ES2337207 T3 ES 2337207T3 ES 07732383 T ES07732383 T ES 07732383T ES 07732383 T ES07732383 T ES 07732383T ES 2337207 T3 ES2337207 T3 ES 2337207T3
Authority
ES
Spain
Prior art keywords
copies
nucleic acid
amplification
sample
acid sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07732383T
Other languages
English (en)
Inventor
Maden Thangavelu
Paul Dear
Terence H. Rabbitts
Angelica Daser
Alan Thomas Bankier
Bernard Anri Konfortov
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Medical Research Council
Original Assignee
Medical Research Council
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Medical Research Council filed Critical Medical Research Council
Application granted granted Critical
Publication of ES2337207T3 publication Critical patent/ES2337207T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Transition And Organic Metals Composition Catalysts For Addition Polymerization (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Hardware Redundancy (AREA)
  • Supplying Of Containers To The Packaging Station (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Steroid Compounds (AREA)

Abstract

Procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes: (a) proporcionar una diversidad de alícuota(s) de la muestra, en la que cada alícuota comprende ácido nucleico en una cantidad que es inferior a un genoma por alícuota; (b) ampliar una o más secuencias de ácido nucleico en cada alícuota(s) en una primera reacción de amplificación; (c) subdividir uno o más de los productos empleados en alícuotas de la réplica y llevar a cabo una segunda reacción de amplificación para una o más secuencias de ácido nucleico en cada alícuota(s), en la que cada una de las secuencias de ácido nucleico es un marcador de prueba y por lo menos una de las secuencias de ácido nucleico es un marcador de referencia; (d) calcular el número de copias por comparación en cada una de las alícuotas de la réplica del número de productos amplificados obtenido en el marcador de prueba con el número de productos amplificados obtenidos para el marcador de referencia.

Description

Procedimiento para determinar el número de copias.
Campo de la invención
La presente invención se refiere a un procedimiento para la detección de cambios en el número de copias de secuencias de ácido nucleico (tales como el ADN genómico) y varias aplicaciones de este procedimiento. A título de ejemplo, el procedimiento puede utilizarse para la detección de alteraciones genómicas y el diagnóstico de enfermedades, tal como el cáncer. Además, se describe asimismo una transposición no recíproca t(3;5) identificada por el procedimiento de la presente invención.
Antecedentes de la invención
Las alteraciones cromosómicas (por ejemplo anomalías) están asociadas con frecuencia a trastornos genéticos, enfermedades degenerativas y cáncer. La deleción o multiplicación de copias de cromosomas completos y la deleción o las amplificaciones de segmentos cromosómicos o de zonas específicas son sucesos frecuentes en la enfermedad, tal como el cáncer (Breast Cancer Res. Treat. 18: Supl. 1:5-14; Biochim. Biophys. Acta. 1072:33-50). De hecho, las amplificaciones y deleciones de la secuencia de ADN pueden ser causa de enfermedad. Por ejemplo, los protooncogenes y los genes supresores del tumor, respectivamente, son con frecuencia característicos de la tumorigénesis (Cancer Genet. Cytogenet. 49:203-217). Evidentemente, la identificación y clonación de zonas genómicas específicas asociadas a la enfermedad es crucial tanto para el estudio de la enfermedad como para el desarrollo de mejores medios de diagnóstico y pronóstico.
Los procedimientos para determinar el estado de los genomas individuales se requieren después del periodo de secuenciado del genoma para llevar a cabo los objetivos de la medicina personalizada, preventiva y de diagnóstico. Los genomas afectados (por ejemplo de cáncer) presentan muchas anomalías aunque las anomalías cromosómicas hereditarias están asociadas a muchos síndromes complejos y predisposiciones a enfermedades. Realmente, el secuenciado propuesto de una gama de genomas completos de cáncer debe enfocarse mejor en aquellas regiones en las que están situadas las aberraciones, utilizando procedimientos de exploración de genomas para dichos cambios. Los neoplasmas con frecuencia presentan aberraciones citogenéticas complejas que incluyen deleciones, amplificaciones y transposiciones. Aunque las leucemias y los sarcomas por lo general presentan transposiciones cromosómicas recíprocas (2), los tumores epiteliales (que comprenden más del 90% de los cánceres humanos) son mucho más heterogéneos (1). Los episodios principales en los tumores epiteliales son la ganancia o pérdida de cromosomas y las transposiciones desequilibradas. Además de esto, existen pequeñas anomalías citogenéticamente invisibles en tumores, por ejemplo las encontrados a veces en asociación con transposiciones cromosómicas (3). Particularmente bien caracterizadas, las transposiciones cromosómicas no recíprocas son las der3 t(3;5) desequilibradas en el adenocarcinoma renal (4,5). Estas anomalías se asocian específicamente al adenocarcinoma renal no papilar, en el que se produce a una frecuencia de por lo menos el 15% (6). La aclaración de los puntos de inflexión der(3)t(3;5) de estas transposiciones ha sido obstaculizada porque no son recíprocas.
Un enfoque a este problema podría estar basado en el hecho de que las transposiciones no recíprocas producen un cambio en el número de copias de las secuencias genómicas. Están disponibles numerosas técnicas basadas en la hibridación para explorar el número de copias en los genomas. Estos procedimientos utilizan ADN genómico (7) como sonda para las matrices de BACS o PACS (8, 9) u oligonucleótidos (10, 11) que representan la secuencia de referencia humana o utilizan sondas genómicas de representación (ROMA) (12-14) o matrices de SNP (15). Los procedimientos basados en la matriz, sin embargo, carecen de flexibilidad ya que debe crearse una nueva matriz para cada conjunto de dianas que van a examinarse. Además, estos procedimientos no son siempre cuantitativos ya que la señal de hibridación refleja el número de copias de la zona específica del genoma que corresponde a la sonda. Otros enfoques basados en la RCP cuantitativa requieren la optimización para cada locus evaluado.
El documento DE102004036285 da a conocer un procedimiento para determinar el número de copias de un cromosoma proporcionando una muestra que corresponde a una célula, es decir una copia del genoma. Varios segmentos del genoma se amplían utilizando una serie de cebadores, y se amplían en una segunda reacción de amplificación que amplía distintos fragmentos (véase los párrafos 35 y 40-41) cuya presencia se determina (en el ejemplo de DE102004036285 los fragmentos se originan a partir del cromosoma 2). El número de fragmentos amplificados se compara con el número de fragmentos amplificados en una muestra de referencia.
La presente invención se refiere a las mejoras en la detección de un cambio en el número de copias de una o más secuencias de ácido nucleico.
Sumario de la invención
El procedimiento descrito en la presente memoria (al que se hace referencia como Recuento molecular del número de copias o MCC) mide la frecuencia de número de copias analizando la frecuencia con que se produce la amplificación de una secuencia de ácidos nucleicos (tal como un marcador genómico) al limitar la dilución de ADN.
\newpage
\global\parskip0.930000\baselineskip
Los procedimientos han sido validados explorando el número de copias que acortan la rama del cromosoma 3 humano en el adenocarcinoma renal para situar el punto de inflexión de una transposición no recíproca en 300 pb, permitiendo que se clone. Esta es la primera vez que se ha clonado el punto de inflexión de una transposición no recíproca de novo en el adenocarcinoma renal.
Aspectos del sumario de la presente invención
En un primer aspecto se proporciona un procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes: (a) proporcionar una diversidad de alícuota(s) de la muestra, en el que cada alícuota comprende ácido nucleico en una cantidad que es inferior a un genoma por alícuota; (b) ampliar una o más secuencias de ácido nucleico en cada alícuota(s) en una primera reacción de amplificación; (c) subdividir uno o más de los productos utilizados en las alícuotas de la réplica y llevar a cabo una segunda reacción de amplificación para una o más secuencias de ácido nucleico en cada alícuota(s), en la que cada una de las secuencias de ácido nucleico es un marcador de prueba y por lo menos una de las secuencias de ácido nucleico es un marcador de referencia; (d) calcular el número de copias por comparación en cada una de las alícuotas de la réplica del número de productos amplificados obtenido en el marcador de prueba con el número de productos amplificados obtenidos para el marcador de referencia.
En un segundo aspecto se proporciona un procedimiento de identificación de una o más alteraciones en una muestra de ácido nucleico, que comprende las etapas siguientes: (a) medir la frecuencia del número de copias de una o más secuencias de ácido nucleico en una primera muestra y una segunda muestra según el procedimiento del primer aspecto de la presente invención; (b) opcionalmente repetir iterativamente el procedimiento a resoluciones progresivamente mayores para cada una de las muestras; y (c) identificar una o más diferencias en la frecuencia del número de copias de una o más secuencias de ácido nucleico en la primera y segunda muestras.
En un tercer aspecto se proporciona un procedimiento para diagnosticar una enfermedad en un paciente, que comprende las etapas siguientes: (a) medir la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra según el procedimiento del primer aspecto de la presente invención; y (b) comparar el número de copias de una o más secuencias de ácido nucleico con el número de copias normales de una o más secuencias de ácido nucleico; en la que una diferencia entre los números de copias de una o más secuencias de ácido nucleico en la muestra y el número normal de copias de una o más secuencias de ácido nucleico es indicativo de que el paciente está padeciendo la enfermedad.
En un cuarto aspecto se proporciona un procedimiento para clonar una o más alteraciones en una muestra de ácido nucleico que comprende las etapas siguientes: (a) identificar una o más alteraciones en una muestra de ácido nucleico según el segundo aspecto de la presente invención; y (b) clonar una o más alteraciones.
Un quinto aspecto se refiere a un ácido nucleico aislado que codifica una transposición no recíproca t(3;5), en la que el cromosoma 5q21.3 para la coordenada 105386443 p.b. se fusiona con al cromosoma 3p13 procedente de la coordenada 74111893 p.b. y en el que el resto de adenina en la unión es de uno de los dos cromosomas.
Un sexto aspecto se refiere a un procedimiento para diagnosticar el cáncer en un paciente que comprende la etapa de determinación de la presencia de la transposición t(3;5) no recíproca según cualquiera de las reivindicaciones 24 a 27, en el que la presencia de la transposición es indicadora de que el paciente padece cáncer.
Formas de realización preferidas
Preferentemente, cada alícuota en la primera reacción de amplificación comprende aproximadamente 01, a 0,9 genomas de ADN por reacción de amplificación.
Preferentemente el número de copias del marcador de la prueba se calcula realizando el recuento manual del número de productos de la amplificación para el marcador de prueba y el marcador de referencia.
Preferentemente, el número de copias del marcador de prueba se calcula utilizando la ecuación:
Np=N(1-e^{-Z})
en la que N es el número de alícuotas; Z es el número promedio de productos amplificados por alícuota; y Np es el número de alícuotas que cabe esperar que contengan por lo menos una molécula del ácido nucleico según la distribución de Poisson.
Preferentemente, el número de copias del marcador de prueba se calcula utilizando la ecuación:
Z=- ln(1-Np/N)
en la que N es el número de alícuotas del ácido nucleico sometido a prueba para una secuencia dada; Np es el número de alícuotas que puntúan positivo para el ácido nucleico.
\global\parskip0.890000\baselineskip
Preferentemente, las reacciones de amplificación se llevan a cabo utilizando la RCP.
Preferentemente, la primera reacción de amplificación se lleva a cabo utilizando pares cebadores directo e inverso.
Preferentemente, la segunda reacción de amplificación se lleva a cabo utilizando pares cebadores directo-interno e inverso.
Preferentemente, la muestra procede o es procedente de un grupo constituido por el cromosoma 1, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, cromosoma 14, cromosoma 15, cromosoma 16, cromosoma 17, cromosoma 18, cromosoma 19, cromosoma 20, cromosoma 21, cromosoma 22, cromosoma X y cromosoma Y.
Preferentemente, la concentración de ácido nucleico en la muestra antes de la división en alícuotas se determina por espectrofotometría UV.
Preferentemente, la concentración de ácido nucleico en la muestra antes de la división en alícuotas se determina por amplificación de uno o más ácidos nucleicos que se cree que están presentes en sólo una copia por genoma haploide en dos o más divisiones diferentes, en la que la proporción de muestras en cada dilución hallada positiva para uno o más ácidos nucleicos se utiliza para mejorar la concentración estimada de ADN y por consiguiente determinar la dilución requerida para el análisis posterior.
Preferentemente, se amplían 4 ácidos nucleicos y se preparan 6 diluciones.
Preferentemente, las muestras son o proceden de pacientes enfermos y sanos.
Preferentemente, se explora inicialmente un cromosoma completo antes de enfocar en un área para posterior estudio.
Preferentemente, el procedimiento se lleva a cabo inicialmente a una resolución de aproximadamente 2 Mb disminuyendo progresivamente hasta aproximadamente 100 pares de bases o menos.
Preferentemente, la alteración es una transposición, una amplificación; una duplicación o una deleción.
Preferentemente, si el número de copias de una o más secuencias de ácido nucleico en la muestra de ácido nucleico del paciente es mayor que el número de copias normales es indicativo de una transposición, una amplificación o una duplicación.
Preferentemente, si el número de copias de una o más secuencias de ácido nucleico en la muestra de ácido nucleico del paciente es menor que el número de copias normales es indicativo de una deleción.
Preferentemente, la enfermedad es el cáncer.
Preferentemente, el cáncer es cáncer de riñón.
Preferentemente, el paciente se selecciona de entre el grupo constituido por: (i) un paciente que está padeciendo o se sospecha que padece la enfermedad; (ii) un paciente que se sabe que está predispuesto a la enfermedad; (iii) un paciente que ha estado expuesto a uno o más agentes o enfermedades que se conoce o se sospecha que producen la enfermedad; (iv) un paciente que está en proceso de desarrollar la enfermedad o se sospecha que desarrolla la enfermedad.
Preferentemente, la alteración se clona utilizando RCP inversa.
Preferentemente, el cromosoma 5q21.3 comprende la secuencia TATACATACATACGGATATATGTATAAAATC.
Preferentemente, el cromosoma 3p13 comprende la secuencia TAGGGAGTGAAGTAGTGGCCAAGAAAACAT
GCCAG.
Preferentemente, la transposición t(3;5) no recíproca comprende la secuencia TATACATACATACGGATATATG
TATAAAATCATAGGGAGTGAAGTAGTGGCCAAGAAAACATGCCAG.
Preferentemente, el cáncer es el adenocarcinoma renal.
Ventajas
La presente invención presenta numerosas ventajas. Estas ventajas se pondrán de manifiesto en la descripción siguiente.
A título de ejemplo la presente invención presenta ventajas ya que el procedimiento proporciona la resolución realmente ilimitada ya que las secuencias pueden examinarse a intervalos por debajo de unos pocos centenares de pares de bases y sería igualmente aplicable a la caracterización de las zonas amplificadas.
\global\parskip1.000000\baselineskip
A título de ejemplo adicional, la presente invención presenta ventajas ya que solamente necesita una base de datos genómica para su operación y los bancos de cebadores de RCP permiten la rápida exploración de zonas cromosómicas o de genomas completos.
A título de ejemplo adicional, la presente invención presenta ventajas debido a que puede conseguirse cualquier nivel de resolución dependiendo de la densidad de marcadores seleccionada. Por consiguiente, el área de estudio está fácilmente bajo control.
A título de ejemplo adicional, la presente invención presenta ventajas porque a diferencia de otras tecnologías de recuento de ADN, los procedimientos descritos en la presente memoria no requieren la amplificación del genoma total o cualquier etapa de hibridación. Esto obvia algunos problemas que puedan dar lugar a la amplificación del genoma específico de la zona, la supresión incompleta de las secuencias de repetición en la sonda y elimina cualquier riesgo de hibridación cruzada, como puede ocurrir en las oligomatrices cortas o en la amplificación del ADN de E. coli que contamina las BAC/PAC para la matriz CGH (9).
A título de ejemplo, la presente invención presenta ventajas porque los procedimientos son esencialmente digitales (recuento del número de copias molecular) que simplifica la interpretación de resultados mientras que las estrategias de micromatriz pueden requerir calcular por ordenador los algoritmos para su interpretación (23).
A título de ejemplo, la presente invención presenta ventajas porque los procedimientos se prestan a automatización, y son adecuados para alto rendimiento, aunque es también fácilmente aplicable a la operación y por lo tanto no tienen requisitos obligados para el sistema, tales como matriciales.
A título de ejemplo adicional, la presente invención presenta ventajas porque el procedimiento requiere cantidades minúsculas de ADN genómico, que son aplicables al ADN desde tan poco como decenas de centenares de células y el ADN no ha de ser de alto peso molecular. Los procedimientos permitirán estudios impracticables hasta ahora, tales como el análisis detallado del material de biopsia preneoplástica procedente de pacientes, el análisis retrospectivo de muestras de tumorales de archivo o la exploración de la variabilidad genómica a través de diferentes pequeñas regiones de un tumor.
A título de ejemplo adicional, la presente invención presenta ventajas porque los procedimientos descritos en la presente memoria deberían también simplificar el análisis de anomalías cromosómicas hereditarias que afectan al número de copias, si están asociadas a la enfermedad o forman parte de un espectro normal de variación humana.
Descripción de las figuras
Figura 1
Generalidades del procedimiento de recuento molecular del número de copias
El recuento molecular del número de copias (MCC) se basa en la frecuencia de los productos de amplificación por RCP del ADN genómico, correspondiente a los marcadores cromosómicos a lo largo de un segmento de un cromosoma. El MCC es un procedimiento en dos etapas. En esta figura, (A) las células llevan una transposición no recíproca y por consiguiente una secuencia marcadora (representada en verde) está presente en dos veces tantas copias como un segundo marcador (representado en rojo) que une el telomérico del punto de inflexión de la transposición. (B) El ADN se prepara a partir de las células diana y se diluye a menos de un genoma por alícuota. (C) Estas alícuotas se suministran a los pocillos de una placa de 96 pocillos; por simplicidad, solamente se ilustran los marcadores rojo y verde, que muestran el número limitado de pocillos que recibe el ADN genómico del marcador rojo y verde. (D) Una amplificación por RCP múltiple inicial se lleva a cabo para ampliar todos los marcadores mediante una cantidad modesta y se ilustran los supuestos pocillos en los que se amplían los marcadores rojo y verde. (E, F) Los productos de reacción múltiple se cortan y empalman en placas de réplica y se lleva a cabo una ronda adicional de RCP realizada con los cebadores semianidados para cada marcador (E: presenta la distribución hipotética del producto del marcador rojo y F presenta la distribución hipotética del producto del marcador verde). (G, H) Los productos de la RCP de la etapa semianidada se analizan por electroforesis en gel. En esta ilustración, el marcador rojo se encuentra en 24 de los pocillos y el marcador verde en 46 de los pocillos, correspondientes a un aumento del doble del número de copias.
Figura 2
Hibridación in situ de clones de BAC con cromosomas SK-RC-9 para localizar el punto de inflexión de la transposición t(3;5)
La presencia de una transposición cromosómica no recíproca t(3;5) típica del adenocarcinoma renal no papilar se descubrió en las células SK-RC-9 (línea incompletamente tetraploide) utilizando la fotografía del cromosoma 3 y 5 (Figura 1 complementaria en línea). La posición regional de la t(3;5) se determinó utilizando FISH con los clones BAC del cromosoma 3. Los clones BAC definen una zona de aproximadamente 1 Mb de la rama corta del cromosoma 3 (clon RP11-24E1 situado en 7325.358-73419679 pb, panel A y clon RP11-781E19 situado en 74210885-74236089 pb, panel B) eran verdes marcados con fluorescencia para el análisis FISH de extensiones de la metafase de los cromosomas SK-RC-9 en combinación con las fotografías del cromosoma 5 completo (fluorescencia roja). El clon RP11-24E1 por BAC se hibrida con los brazos cortos de dos cromosomas 3 normales (panel A, rodeado en verde), pero no el cromosoma hibrido transpuesto t(3;5) panel A, (en círculo blanco) lo que indica que BAC es telomérico del punto de inflexión de la transposición t(3;5). El clon RP11-781E19 de BAC se hibrida tanto con los cromosomas 3 normales (panel B, rodeado en verde) así como con los cromosomas híbridos t(3;5) (panel B, rodeados en blanco). Por lo tanto, este BAC cartografía el centrómero del punto de inflexión de t(3;5). Estos datos demuestran que el punto de inflexión de la transposición se produce entre o dentro de la zona del cromosoma definida por estos dos clones de BAC.
C. Representación esquemática de los cromosomas 3 normales y t(3;5) híbrido en SK-RC-9 que presenta la zona del cromosoma 3 que contiene el supuesto punto de inflexión de la transposición t(3;5) determinado por FISH. Los cromosomas 3 se representan en verde y los cromosomas 5 en rojo. La zona que contiene el punto de inflexión está representada en blanco y se expande a continuación, comprendiendo aproximadamente la zona del cromosoma 3p13-p12.3
Figura 3
El procedimiento MCC localiza la ruptura de t(3;5) dentro de los 300 p.b. en el cromosoma 3
Cada gráfico presenta el número de copias relativo (ejes verticales) de las secuencias que comprenden el cromosoma 3p (ejes horizontales; orientación telomérica-centromérica es de izquierda a derecha).
Ronda 1: Se seleccionaron secuencias a intervalos de aproximadamente 200 a 500 kb que comprenden \sim 3,7 Mb, comprendidas por 3p13-p12.3 (la posición cromosómica exacta y las distancias junto con las secuencias del cebador se proporcionan en la Tabla 1). Las series de cebador, a saber las series 5 y 7 no pudieron proporcionar producto (indicadas por líneas de puntos). La inspección visual indicó que un desplazamiento del doble en el número de copias entre los marcadores 8 y 9 (mostrados por la casilla blanca). En las anteriores rondas 2, 3 y 4, se seleccionaron nuevas secuencias con distancias progresivamente más cortas en entre los marcadores. La ronda 4 utilizó marcadores de \sim 300 p.b. (50 a 300 pb) aparte y presentaban un desplazamiento del número de copias que representa el punto de inflexión de la transposición t(3;5) no recíproca (indicada por la casilla en blanco) y una segunda anomalía que representa una deleción corta de aproximadamente 700 p.b. en la zona del cromosoma 3 (indicada por la casilla punteada) centromérica de la unión de la transposición.
Figura 4
La hibridación en el filtro del ADN de SK-RC-9 presenta un segmento cambiado de posición y pone de manifiesto una inserción que acompaña una microdeleción
A-C. ADN genómico de SK-RC-9 o SK-RC-12 (carcinoma renal de un der(3;5) proximal al de en SK-RC-9) se digirió con las enzimas de restricción indicadas, se fraccionó y se transfirió a los filtros para la hibridación a las sondas clonadas de RCP de uno de ambos cromosomas 3p (3pA o 3pB) o 5q. Las sondas de cromosoma 3p se localizaron en los datos de MCC en la Figura 3 y se identificó una secuencia genómica sin repetición de esta zona utilizando la base de datos de la secuencia del genoma humano. Asimismo se determinó una sonda procedente del cromosoma 5q en la base de datos de la secuencia del genoma humano después de la clonación y del secuenciado de la unión t(3;5).
D. Cartografías de restricción parcial de las zonas adecuadas de los cromosomas 5q, t(3;5) y 3p que muestran la posición de las sondas de hibridación en una de las dos caras del punto de inflexión de t(3;5) (existían dos sondas para el cromosoma 3p, denominadas 3pA y 3pB). La longitud de la inserción, asociada a la pequeña deleción, no es segura y está indicada por la pequeña zona sombreada en gris que incluye una secuencia de la enzima de restricción BgIII como se muestra mediante las hibridaciones en filtro mostradas en B.
B=BgIII; H=HindIII; N=NcoI; RV=EcoRV; S=SpeI.
C= AND genómico de referencia procedente de SK-RC-12; R9= AND genómico de SK-RC-9.
Figura 5
Secuencia y posición cromosómica de la unión de la transposición no recíproca t(3;5)
La posición de la unión de la transposición t(3;5) en el genoma de SK-RC-9 se situó en 300 p.b. por el procedimiento MCC. La base de datos de la secuencia del genoma humano permitió la identificación de las secuencias de restricción en torno a esta supuesta posición y la RCP inversa se utilizó para clonar la unión. Se digirió el ADN de SK-RC-9 con XbaI, autoligadas a alta dilución para obtener círculos intramoleculares y un producto de RCP obtenido por amplificación con los cebadores F y R (panel A) (véanse los procedimientos para las secuencias del cebador). La secuencia de los productos de la RCP confirmó que la unión de la transposición no recíproca t(3;5) se había clonado y la unión comprendía las secuencias contiguas 5q (panel B, secuencia encasillada en rojo) y 3p (panel B, secuencia encasillada en verde). Debe apreciarse que el residuo A adicional individual en la unión de la secuencia fusionada (posición representada por la flecha) puede haber procedido de uno de los dos cromosomas. La posición de los puntos de inflexión de la transposición se determinó en los cromosomas 5q y 3p utilizando la base de datos Ensembl humana (NCBI liberación 35) y se indica en los paneles C (5q) y D (3p). En cada uno de estos paneles, la línea superior indica las bandas de cromosomas relevantes y las distancias a Mb y debajo se muestran varios genes conocidos o supuestos. La posición de los genes Ensembl se presenta tanto para el cromosoma 5 (C) como para el cromosoma 3 (D). Se muestra una transcripción prevista Genscan (AN038241) a 106,58 Mb en el cromosoma 5 y dos ARNm situados en el cromosoma 3, BC040672 (ADNc de Riken) y HSP90 en 74,10 y 74,2 respectivamente. La transposición t(3;5) de SK-RC-9 no corta ni empalma los genes en el cromosoma 3 ni en el cromosoma 5.
Figura 6
Cartografía por MCC de una deleción del cromosoma 3 en la SK-RC-12
A. Para la cartografía de la ronda 1 de MCC, se utilizó un panel de 35 marcadores para identificar una zona genómica de \sim9 Mb) con intervalos de marcador alrededor de 0,25 Mb aparte. Se detectó un desplazamiento del número de copias entre los marcadores 22 y 23. Los resultados se presentan para el panel del marcador en el eje y el número del marcador en el eje x. Las distancias entre los marcadores no reflejan distancias genómicas sino que son numéricas. Las zonas encasilladas representan los desplazamientos de la copia baja y de la copia alta. Basándose en los datos de la ronda 1, se diseñaron una segunda serie de cebadores espaciados a un promedio de 30 kb aparte, demostrando que la variación del número de copias se cartografió entre los marcadores 9 y 13. Posteriormente, se realizaron dos rondas más de MCC utilizando los marcadores a aproximadamente 3 kb (ronda 3) y 400 p.b. aparte (ronda 4). Un desplazamiento del número de copias aparece entre los marcadores 6 y 7 en la ronda 4 definiendo una posición del desplazamiento en 800 p.b. de cromosoma 3.
B. La zona genómica del ADN con SK-RC-12 con este desplazamiento del número de copias se clonó después de la RCP inversa y se puso de manifiesto una deleción crítica del cromosoma 3 en las células SK-RC-12. La secuencia superior (caso superior) se extiende desde el extremo telomérico de la deleción del cromosoma 3p y la secuencia inferior (caso inferior) se extiende desde el extremo centromérico de la deleción del cromosoma 3p mientras que la secuencia media es la fusión hallada en la unión de la deleción en el ADN de SK-RC-12 situado a 81,64 y 81,94 mb.
Figura 7
Cuadro de los cromosomas de la metafase de SK-RC-9
Las imágenes fundidas se presentan en señales de hibridación con el cromosoma 3 (rojo) o 5 (verde) y la tinción con DAPI de la metafase en los cultivos de SK-RC-9 (esta estirpe es incompletamente tetraploide), mostrando la presencia de la transposición cromosómica t(3;5) no recíproca típica del adenocarcinoma renal no papilar. Los cuadros del cromosoma se obtuvieron a partir de Vysis.
Figura 8
Identificación de la microdeleción en el cromosoma t(3;5) de SK-RC-9
Se obtuvieron datos por MCC de la ronda 4 de la RCP (como en la Fig. 3 del texto principal) utilizando SK-RC-9 en experimentos por duplicación o SK-RC-12 como referencia. La transposición y las zonas de microdeleción presentan desplazamientos del número de copias reproducibles, mientras que el ADN de SK-RC-12 de referencia presenta una curva horizontal sin desplazamiento del número de copias en esta zona.
Figura 9
Fraccionamiento con gel de agarosa de los productos de la RCP para la ronda 1 por MCC del ADN de SK-RC-12
Se llevó a cabo la ronda uno por análisis de MCC con ADN de SK-RC-12 utilizando los marcadores que comprenden una zona que comprende aproximadamente 0,25 mb del cromosoma 3p (véase la Fig. 6A, ronda 1) que presenta un desplazamiento del número de copias entre los marcadores 22 y 23. Se presentan los geles analíticos para los productos de la RCP semianidados de los marcadores 21, 22, 24 y 25.
Figura 10
Hibridación en filtro del ADN de SK-RC-12 para confirmar la alteración genómica detectada por MCC
La MCC del ADN del cromosoma 3p de SK-RC-12 identificó un desplazamiento del número de copias en una zona de 400 p.b. (véase la Fig. 6A, ronda 4) indicativo de una alteración genómica. Esto se confirmó por hibridación en el filtro del ADN genómico de SK-RC-12 en comparación con el ADN preparado a partir de una estirpe celular linfoblastoide (LCL) de referencia. Una sonda de 237 p.b. se amplió en el cromosoma 3 y se hibridó a los digestos de restricción indicados. Se observó un fragmento cambiado de posición en cada caso con el ADN de SK-RC-12 en comparación con el de LCL.
Descripción detallada de la invención Alteración
Tal como se utiliza en la presente memoria, el término "alteración" se refiere a un cambio (tal como un cambio conocido u oculto) que implica la pérdida o ganancia de material genético.
Convenientemente, la alteración es una alteración del número de copias (tal como una alteración del número de copias en estado diploide) que puede determinarse haciendo el recuento de la frecuencia de reiteración del ADN utilizando los procedimientos descritos en la presente memoria.
En una forma de realización, la alteración es una anomalía, tal como una anomalía cromosómica.
En una forma de realización, la alteración se selecciona de entre el grupo constituido por una transposición (por ejemplo una transposición desequilibrada o una transposición no recíproca), una amplificación; o una duplicación o una deleción.
En una forma de realización particularmente preferida, la alteración es una transposición no recíproca, tal como una transposición no recíproca que se detecta en el ácido nucleico de una célula de cáncer o tumor o derivada de la misma.
\vskip1.000000\baselineskip
Número de copias
La expresión "número de copias" significa el número de copias de una secuencia específica de ácido nucleico (por ejemplo locus) en el genoma de un organismo específico, tal como un ser humano.
\vskip1.000000\baselineskip
Marcador de prueba
Tal como se utiliza en la presente memoria, la expresión "marcador de prueba" se refiere a una secuencia de ácido nucleico, cuyo número de copias debe someterse a prueba según los procedimientos de la presente invención.
\vskip1.000000\baselineskip
Marcador de referencia
Tal como se utiliza en la presente memoria, la expresión "marcador de referencia" se refiere a una secuencia de ácido nucleico, cuyo número de copias ya se conoce o se determina para calcular el número de copias del marcador de prueba. Como se describe en la presente memoria, el número de copias del marcador de prueba se calcula comparando el número de productos amplificados para el marcador de prueba con las del marcador de referencia.
El número de copias del marcador de referencia puede determinarse utilizando los procedimientos descritos en la presente memoria o cualquier otro procedimiento que puede utilizarse para determinar el número de copias de un ácido nucleico, tal como la hibridación del genoma comparativa o la hibridación del genoma comparativa de la matriz y similares. Desde luego, el número de copias del marcador de referencia puede incluso determinarse por referencia a la bibliografía ya que su número de copias puede haber sido descrito anteriormente.
En una forma de realización de la presente invención, se amplían el marcador de prueba y/o el marcador de referencia.
\vskip1.000000\baselineskip
Muestra
El término "muestra" tal como se utiliza en la presente memoria se refiere a una muestra que comprende o está constituida por ácido nucleico por lo general ADN (preferentemente ADN genómico) en una forma adecuada para la detección por amplificación tal como se describe en la presente memoria. Las muestras utilizadas en los presentes procedimientos pueden proceder esencialmente de cualquier organismo, tal como un organismo eucariótico, incluyendo, pero sin limitarse a, seres humanos, ratones, ratas, hámsteres, caballos y vacas.
Preferentemente, la muestra es de un ser humano o procede del mismo.
La muestra puede proceder esencialmente de cualquier fuente asociada a un organismo tal como una muestra de tejido y/o fluido extraída de un individuo o de un grupo de individuos. Los ejemplos ilustrativos incluyen piel, plasma, suero, sangre, orina, lágrimas, órganos, fluido espinal, fluido de linfa y tumores. La muestra puede incluso proceder de cultivos de células in vitro, incluyendo el medio de crecimiento, células recombinantes y componentes celulares.
Cuando las muestras se extraen para diagnóstico o el estudio de un tumor, la muestra por lo general se extrae de un tejido tumoral o de un tejido que se sospecha que presenta el inicio de la formación del tumor. En las técnicas de enriquecimiento, la muestra necesaria para la evaluación de la presencia del tumor pueden obtenerse, por ejemplo, enriqueciendo células tumorales o el ADN del plasma.
Por lo tanto, en muchos casos, la muestra será una muestra de tejido o células en las que el ácido nucleico está aislado y/o clonado y/o amplificado. Puede ser, por ejemplo, ADN genómico procedente de un cromosoma específico, o las secuencias seleccionadas (por ejemplo activadores, genes, fragmentos de amplificación o restricción específicos) con alteraciones específicas, tales como amplicones o deleciones.
Los procedimientos para aislar muestras de células y tejidos son bien conocidos por los expertos en la materia e incluyen, pero no se limitan a, aspirados, secciones de tejidos, biopsias con aguja y similares. Frecuentemente la muestra será una "muestra clínica" que es una muestra procedente de un paciente, que incluye secciones o tejidos tales como secciones congeladas o secciones en parafina extraídas con fines histológicos. La muestra puede proceder también de sobrenadantes (de células) o de las propias células de cultivos celulares, células de cultivo tisular y de otros medios en los que puede ser deseable detectar anomalías cromosómicas y/o determinar el número de copias.
Los procedimientos habituales conocidos en la técnica pueden utilizarse para aislar el ácido nucleico requerido procedente de la muestra.
Una aplicación específica de los procedimientos descritos en la presente memoria es para analizar las secuencias de ADN procedentes de la(s) presente(s) célula(s) o de la población o poblaciones celulares, por ejemplo, procedentes de muestras clínicas incluyendo tejidos tumorales y fetales.
Sin embargo, si el ácido nucleico, por ejemplo, el ADN, debe extraerse de un pequeño número de células (por ejemplo de una subzona tumoral específica) o de una sola célula, a veces puede ser necesario ampliar el ácido nucleico, por un procedimiento de reacción en cadena de la polimerasa (RCP) o por un procedimiento de reacción en cadena sin polimerasa (no-RCP). La RCP y los procedimientos de RCP preferidos se describen en la presente memoria. Los procedimientos de no-RCP ilustrativos incluyen la reacción en cadena de la ligasa (RCL) y la amplificación lineal mediante la utilización de cebadores apropiados y su amplificación (cebado aleatorio) tal como se describe en la presente memoria.
Ventajosamente, los ácidos nucleicos de muestras de tejido archivadas, por ejemplo, muestras de patología empapadas en parafina o fijadas en formalina, pueden analizarse por los procedimientos descritos en la presente memoria. El ácido nucleico de dichas muestras puede extraerse por técnicas conocidas tales como las descritas en Anatomic Pathology 95(2); 117-124 (1191) y Cancer Res. 46: 2964-2969 (1986), y si es necesario, amplificadas para análisis. Dicho ácido nucleico puede ampliarse utilizando un procedimiento de reacción en cadena de la polimerasa (RCP) en la que por ejemplo, el ADN procedente de los tejidos empapados en parafina se amplía por RCP.
Un valor específico de analizar dicho ácido nucleico archivado es que dichas muestras están normalmente asociadas a los registros médicos de pacientes de los que se extraen las muestras. Por consiguiente, pueden hacerse asociaciones de diagnóstico/pronóstico valiosas entre el estado puesto de manifiesto del material del ácido nucleico del paciente y los antecedentes médicos del tratamiento y los resultados para estos pacientes. Por ejemplo, la información reunida por los procedimientos descritos en la presente memoria puede utilizarse para predecir la agresividad de un tumor basado en su modelo de amplificación y/o deleción correspondiente a las asociaciones realizadas con patrones similares de los pacientes cuyos resultados se conocen.
Asimismo, otro ácido nucleico que se fija por otros procedimientos - tal como el material arqueológico conservado mediante procedimientos de fijación natural - puede estudiarse también. Las diferencias del número de copias entre las especies proporcionan información del grado de similitud y divergencia de las especies estudiadas. Las conexiones y discrepancias importantes desde el punto de vista de la evolución entre las especies que existen o se han extinguido pueden hacerse por consiguiente utilizando los procedimientos descritos en la presente memoria.
Tal como se describe en la presente memoria, una vez se ha preparado la muestra, puede dividirse en una o más alícuotas (por ejemplo varias alícuotas). En el contexto del número de alícuotas, el término "varias" significan 2 o más, preferentemente 10 o más, preferentemente 20 o más, preferentemente 30 o más, preferentemente 40 o más, preferentemente 60 o más, preferentemente 80 o más, preferentemente 90 o más, o incluso preferentemente, 100, 200, 300, 400, 600, 800 o incluso 1000 o más.
En una forma de realización particularmente preferida, los procedimientos de la presente invención se realizan en una o más placas que contienen varios pocillos. Preferentemente la plaza contiene 96 pocillos o 384 pocillos. Pueden utilizarse también placas de otros tamaños adecuados. Por consiguiente, el número de alícuotas de las muestras que por lo general se correlacionan con el número de pocillos en la placa. Sin embargo, cuando se utilizan dichas placas, la muestra no está necesariamente en alícuotas en cada uno y en todos los pocillos ya que pueden utilizarse uno o más pocillos como referencias. A título de ejemplo, si se realiza un experimento en una o más placas de 96 pocillos, entonces aproximadamente 8 pocillos más o menos de cada placa pueden utilizarse como referencias negativas, que no se ponen en contacto con las alícuotas de la muestra. Así, las referencias negativas carecen de ácido nucleico - tal como ADN genómico - que es o procede de la muestra.
\newpage
Cada alícuota de la muestra utilizada según la presente invención comprende menos de un genoma para la reacción de amplificación tal como se define para la cartografía HAPPY (22). Preferentemente cada alícuota de la muestra utilizada según la presente invención comprende aproximadamente 0,9, 0,8, 0,7, 0,6, 0,5, 0,4, 0,3, 0,2 ó 0,1 genomas o menos por reacción de amplificación. Más preferentemente, cada alícuota de la muestra utilizada según la presente invención comprende un intervalo que consiste en cualquier punto de partida o final adecuado del número de genomas por reacción de amplificación, tal como aproximadamente 0,1 a 0,9 genomas por reacción de amplificación o como aproximadamente 0,3 a 0,5 genomas por reacción de amplificación. Más preferentemente, cada alícuota de la muestra utilizada según la presente invención comprende aproximadamente 0,3 genomas por reacción de amplificación.
Para determinar la concentración exacta de ADN en la muestra antes de la preparación de alícuotas, pueden realizarse ensayos iniciales utilizando un intervalo de diluciones de ADN que cabe esperar (basándose en la concentración de ADN determinada por espectrometría de UV) que proporcionen entre 0,25 y 8 genomas de ADN por muestra. Pueden analizarse aproximadamente 4 secuencias de ácido nucleico por muestra de ácido nucleico a diferente diluciones (tal como 6 diluciones) para diferentes secuencias de ácido nucleico que se cree que están presentes solamente en una copia por genoma haploide. La proporción de muestras de cada dilución hallada positiva para estos marcadores se utiliza para refinar la concentración estimada de ácido nucleico y por consiguiente determinar la dilución requerida para el análisis posterior.
\vskip1.000000\baselineskip
Amplificación
Tal como se utiliza en la presente memoria, "amplificación" se refiere a cualquier procedimiento para multiplicar las cadenas de ácido nucleico (tal como el ADN genómico) in vitro.
Preferentemente, el procedimiento es enzimático y es lineal o de carácter exponencial.
Las técnicas de amplificación incluyen, pero no se limitan a, los procedimientos ampliamente clasificados como procedimientos de amplificación de ciclación térmica y los procedimientos de amplificación isotérmicos. Los procedimientos de ciclación térmica adecuados incluyen, por ejemplo, la reacción en cadena de la ligasa (Genomics 4:560, (1989); y Science 241: 1077 (1988)). La reacción en cadena de la ligasa utiliza la ADN ligasa y cuatro oligonucleótidos, 2 por cadena diana. Los oligonucleótidos se hibridan con las secuencias adyacentes en el ácido nucleico que debe ampliarse y se unen mediante la ligasa. La reacción se desnaturaliza térmicamente y se repite el ciclo. Los procedimientos de amplificación isotérmicos útiles en la presente invención incluyen, por ejemplo, la amplificación con desplazamiento de cadena (SDA) (Proc. Nat. Acad. Sci. EE.UU. 89:392-396 (1992)), Q-beta-replicasa (Bio/Technology 6:1197-1202 (1988)); amplificación de la secuencia de ácido nucleico (NASBA) (Bio/Technology 13:563-565 (1995)); y la replicación de la secuencia automantenida (Proc. Nat. Acad. Sci. EE.UU. 87:1874-1'878 (1990)).
Un procedimiento de amplificación particularmente preferido es la RCP. Como es bien conocido por los expertos en la materia, este es un procedimiento en el que prácticamente toda la secuencia de ácido nucleico puede ampliarse selectivamente. El procedimiento implica utilizar series emparejadas de oligonucleótidos de la secuencia predeterminada que se hibridan con las cadenas opuestas de ADN y definen los límites de la secuencia que debe ampliarse. Los oligonucleótidos ceban rondas múltiples sucesivas de síntesis de ADN catalizadas por una ADN polimerasa termoestable. Cada ronda de síntesis es separada por lo general por una etapa de fusión y rehibridación, permitiendo que se amplíe una secuencia de ADN dada varias cientos de veces en menos de una hora (Science 239:487, 1988). Como se describe en la presente memoria, más de un ácido nucleico puede ampliarse simultáneamente por RCP múltiple en la que se emplean múltiples cebadores emparejos.
El ácido nucleico puede marcarse en uno o más nucleótidos durante o después de la amplificación.
Tal como se describe en la presente memoria, los procedimientos se realizan utilizando una reacción de amplificación en dos fases.
\vskip1.000000\baselineskip
Primera reacción de amplificación
La primera reacción de amplificación es por lo general una etapa de amplificación con cebadores externos multiplexados con objeto de ampliar una o más, preferentemente dos o más (por ejemplo varias) secuencias de ácido nucleico. Cuando se analizan genes y directos grandes o genes indefinidos, se requieren con frecuencia muchas reacciones de amplificación individuales para identificar las alteraciones. Por lo tanto, para racionalizar el análisis de grandes genes complejos, pueden utilizarse cebadores múltiples para la amplificación simultánea de diferentes secuencias de ácido nucleico en una sola reacción de amplificación. Los procedimientos para la preparación de cebadores múltiples son conocidos en la técnica, como se describe, por ejemplo en la patente US nº 6.207.372.
En una forma de realización, se amplían uno o más marcadores (por ejemplo un marcador de prueba y/o un marcador de referencia).
En otra forma de realización, se amplían dos o más marcadores (por ejemplo un marcador de prueba y/o un marcador de referencia).
En otra forma de realización, se amplían todos los marcadores.
En otra forma de realización, se amplían todas las copias de una o más secuencias o marcadores.
En otra forma de realización, se amplían uno o más marcadores, dos o más marcadores o todos los marcadores en una zona cromosómica o genómica o locus de interés.
Para la primera reacción, se prepara ácido nucleico y se diluye a menos de aproximadamente un genoma por alícuota. Si el procedimiento de amplificación seleccionado es la RCP entonces puede preparase una mezcla maestra que contiene los cebadores de todas las secuencias que deben ampliarse en tampón de RCP (tal como el tampón Gold PCR (Perkin-Elmer)), MgCl_{2}, tal como aproximadamente MgCl_{2} 2 mM, las dNTP, tal como aproximadamente 200 \muM de cada dNTP y Taq ADN polimerasa, tal como aproximadamente 0,1 U/\mul de Taq Gold ADN polimerasa (Perkin-Elmer).
De manera adecuada, el ácido nucleico se divide en varias alícuotas.
De manera adecuada, el ácido nucleico se divide en varias alícuotas idénticas o sustancialmente idénticas.
De manera adecuada, cada una de las alícuotas que se prepara se suministra a un pocillo o receptáculo. Por consiguiente, en una forma de realización de la presente invención, las reacciones de amplificación se realizarán en paralelo utilizando, por ejemplo, placas de 96 pocillos. De este modo, las alícuotas de la mezcla madre se distribuirán en, por ejemplo, 8 pocillos de las placas de 96 pocillos (referencias negativas), y posteriormente, aproximadamente 0,03 genomas/\mul del ADN genómico añadido a la mezcla madre para análisis. Las alícuotas de esta mezcla (conteniendo cada una aproximadamente 0,3 genomas de ADN) se reparten en alícuotas en cada uno de los pocillos restantes y los pocillos de referencia reciben una mezcla equivalente pero que carece de ADN genómico (referencias negativas). Todas las muestras se cubren con aceite mineral (aproximadamente 20 \mul).
Una reacción de amplificación inicial puede realizarse para ampliar uno o más marcadores en cada una de las alícuotas. Preferentemente, se amplían todos los marcadores en cada una de las alícuotas.
El ciclo térmico se realiza por lo general con inicio en caliente a aproximadamente 93ºC durante aproximadamente 9 minutos, seguido de aproximadamente 25 ciclos de aproximadamente 20 segundos a aproximadamente 94ºC, aproximadamente 30 segundos y aproximadamente 52ºC y aproximadamente 1 minuto a aproximadamente 72ºC. El experto en la materia apreciará que pueden introducirse variaciones de esta reacción de ciclo térmico.
Cada uno de los productos amplificados se diluyen hasta una cantidad que es suficiente para la segunda reacción de amplificación para ampliar el ácido nucleico contenido en la misma.
En una forma de realización de la presente invención resulta preferido que la primera reacción de amplificación esté automatizada.
\vskip1.000000\baselineskip
Segunda reacción de amplificación
Adecuadamente, uno o más (por ejemplo cada uno) de los productos amplificados de la primera reacción de amplificación se subdividen o se cortan y empalman en una o más muestras de réplica o alícuotas de la réplica.
Adecuadamente, uno o más (por ejemplo cada uno) de los productos amplificados de la primera reacción de amplificación se subdivide, se cortan y empalma o se suministra en uno o más pocillos de réplica o receptáculos de réplica.
Por consiguiente, antes de la segunda reacción de amplificación se preparan uno o más conjuntos de la réplica de los productos amplificados procedentes de la primera reacción de amplificación. Adecuadamente, la serie de productos amplificados de la réplica comprende 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% ó 100% de cada uno de los productos amplificados para la primera reacción de amplificación. Preferentemente, la serie de la réplica de los productos amplificados comprende 90%, 95%, 96%, 97%, 98%, 99% o 100% de cada uno de los productos amplificados procedentes de la primera reacción de amplificación.
Por lo general, una o más (por ejemplo cada una de las) alícuotas procedentes de la primera reacción de amplificación se subdivide o se suministra a un número de muestras de la réplica, alícuotas, pocillos o receptáculos que se correlacionan con el número de marcadores que se amplían. De manera adecuada, un marcador se amplía en cada una de las muestras de la réplica, alícuotas, pocillos o receptáculos. Por lo tanto, a título de ejemplo, si se amplían cuatro marcadores entonces cada alícuota de la primera reacción de amplificación se subdivide, corta o empalma o se suministra en cuatro muestras de la réplica, alícuotas, pocillos o receptáculos. Un primer marcador se ampliará en una primera de las muestras de la réplica, alícuotas, pocillos o receptáculos, un segundo marcador se ampliará en una segunda de las muestras de la réplica, alícuotas, pocillos o receptáculos y así sucesivamente.
\newpage
En una forma de realización de la presente invención, se amplía uno o más de los productos de amplificación obtenidos o que pueden obtenerse a partir de la primera reacción de amplificación.
Por lo general, la segunda reacción de amplificación se lleva a cabo utilizando una reacción de amplificación semianidada en la que se utiliza el mismo cebador complementario tal como se utiliza en la primera reacción de amplificación en combinación con un cebador directo interno para cada marcador que va a ampliarse.
Si la segunda amplificación se lleva a cabo utilizando la RCP entonces por lo general, la RCP semianidada utiliza MgCl_{2}, tal como aproximadamente MgCl_{2} 1,5 mM y aproximadamente 1 \muM de los cebadores directo interno y complementario apropiados. Las otras concentraciones son aproximadamente las mismas que las utilizadas para la primera reacción de amplificación como anteriormente.
En una forma de realización, el ciclo térmico se lleva a cabo a aproximadamente 93ºC durante aproximadamente 9 minutos, seguido de aproximadamente 33 ciclos de aproximadamente 20 segundos a aproximadamente 94ºC, aproximadamente 30 segundos a aproximadamente 52ºC y aproximadamente 1 minuto a aproximadamente 72ºC). El experto en la materia apreciará que pueden introducirse variaciones de esta reacción de ciclo térmico.
Ventajosamente, las reacciones de amplificación de la segunda fase se organizan mediante robots en placas de microvaloración múltiples de 384 pocillos de modo que cada una de las primeras 96 reacciones de amplificación pueden identificarse para cada uno de los diferentes marcadores. Por lo tanto, a título de ejemplo, si se identifican cuatro secuencias de ácido nucleico en la segunda amplificación, entonces puede utilizarse una placa de 384 pocillos proporcionando de este modo 96 pocillos para cada una de las cuatro secuencias de ácido nucleico. Alternativamente, la segunda etapa de amplificación semianidada puede llevarse a cabo en una segunda placa de 96 pocillos si se utiliza una pipeta multicanal para las transferencias, en lugar de un sistema robótico.
En una forma de realización de la presente invención resulta preferido que la segunda reacción de amplificación esté automatizada.
En una forma de realización de la presente invención resulta preferido que la primera y la segunda reacciones de amplificación estén automatizadas.
Ventajosamente, los procedimientos descritos en la presente memoria pueden utilizarse en combinación con otras reacciones de amplificación. A título de ejemplo, los procedimientos descritos en la presente memoria pueden utilizarse en combinación con una o más reacciones RCP que detectan anomalías genéticas, tales como las transposiciones recíprocas.
En un aspecto adicional, se suministra un procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes:
(a)
suministrar una variedad de alícuotas de la muestra, en las que cada alícuota comprende ácido nucleico en una cantidad que es inferior a la de un genoma por alícuota; (b) ampliar una o más secuencias de ácido nucleico de cada una de varias alícuotas en una primera reacción de amplificación; (c) ampliar en una segunda reacción de amplificación una o más secuencias de ácido nucleico de cada una de varias alícuotas preparadas según la etapa (b) en la que por lo menos una de las secuencias de ácido nucleico es un marcador de prueba; y (d) calcular el número de copias del marcador de prueba comparando el número de productos amplificados para el marcador de prueba con los de un marcador de referencia.
\vskip1.000000\baselineskip
En un aspecto adicional, se suministra un procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes:
(b)
suministrar una variedad de alícuotas de la muestra, en las que cada alícuota comprende ácido nucleico en una cantidad que es inferior a la de un genoma por alícuota; (b) ampliar una o más secuencias de ácido nucleico de cada una de varias alícuotas en una primera reacción de amplificación; (c) ampliar en una segunda reacción de amplificación una o más secuencias de ácido nucleico de cada una de varias alícuotas preparadas según la etapa (b) en la que por lo menos una de las secuencias de ácido nucleico es un marcador de prueba y por lo menos una de las secuencias de ácido nucleico es un marcador de referencia; y (d) calcular el número de copias del marcador de prueba comparando el número de productos amplificados para el marcador de prueba con los de un marcador de referencia.
\vskip1.000000\baselineskip
En un aspecto adicional, se suministra un procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes:
(a)
suministrar una o más (por ejemplo una variedad de) alícuota(s) de la muestra, en la que cada alícuota comprende ácido nucleico en una cantidad que es inferior a la de un genoma por alícuota; (b) ampliar uno o más (preferentemente todos) los marcadores de cada alícuota(s) en una primera reacción de amplificación; (c) distribuir cada uno de los productos de amplificación procedentes de la primera reacción de amplificación en la muestras de réplica; (d) ampliar en una segunda reacción de amplificación uno o más marcadores de cada alícuta(s) en las muestras de réplica preparadas según la etapa (c), en la que por lo menos una de las secuencias de ácido nucleico es un marcador de prueba; y (e) calcular el número de copias del marcador de prueba comparando el número de productos amplificados para el marcador de prueba con los de un marcador de referencia.
\vskip1.000000\baselineskip
En un aspecto adicional, se suministra un procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes:
(a)
suministrar una o más (por ejemplo una variedad de) alícuota(s) de la muestra, en la que cada alícuota comprende ácido nucleico en una cantidad que es inferior a la de un genoma por alícuota; ampliar uno o más (preferentemente, todos) los marcadores de cada alícuota(s) en una primera reacción de amplificación; (c) distribuir cada uno de los productos de amplificación procedentes de la primera reacción de amplificación en la muestras de réplica; (d) ampliar en una segunda reacción de amplificación dos o más marcadores de cada alícuta(s) en las muestras de réplica preparadas según la etapa (c), en la que por lo menos una de las secuencias de ácido nucleico es un marcador de prueba y por lo menos una de las secuencias de ácido nucleico es un marcador de referencia; y (e) calcular el número de copias del marcador de prueba comparando el número de productos amplificados para el marcador de prueba con los del marcador de referencia.
\vskip1.000000\baselineskip
Cebadores
Los cebadores utilizados en la amplificación se seleccionan de manera que puedan hibridarse con secuencias en las zonas adyacentes de la secuencia de ácido nucleico (por ejemplo locus) que se está ampliando. Los cebadores se seleccionan para que tengan por lo menos complementariedad sustancial con las diferentes cadenas de ácido nucleico que se está ampliando.
El cebador debe tener suficiente longitud de modo que pueda cebar la síntesis de los productos de amplificación en presencia de un agente para la polimerización. La longitud y composición del cebador depende de muchos parámetros, incluyendo, por ejemplo la temperatura a la que se lleva a cabo la reacción de hibridación, la concentración del cebador y la composición específica del ácido nucleico del cebador. Por lo general el cebador incluye de 15 a 30 nucleótidos, preferentemente, de 18 a 20 pb. Para algunas formas de realización de la presente invención, resulta preferido que los cebadores tengan una Tm comprendida entre aproximadamente 52 y 60ºC (basado en el cálculo Tm=2x(A+T)+4x(G+C)). Preferentemente el diseño incluye por lo menos dos bases G o C en el extremo 3' y por lo menos una en el extremo 5'. En general, no se utilizan los cebadores que poseen series de cualquier base individual mayores de 4 bases. La longitud del amplímero interno se diseña para que esté comprendida entre aproximadamente 80 y 150 p.b. y la posición del cebador externo no más de aproximadamente 150 p.b. corriente arriba del cebador directo interno.
La longitud del cebador puede depender más o menos de la complejidad de la zona de unión del cebador y de los factores enumerados a continuación además de los que son conocidos por los expertos en la materia.
Por lo general, los cebadores se hibridan específicamente a una secuencia nucleotídica específica. La expresión "se hibridan específicamente" tal como se utiliza en la presente memoria se refiere a la unión, duplicación o hibridación de un ácido nucleico preferentemente a una secuencia específica en condiciones severas. La expresión "condiciones severas" se refiere a las condiciones bajo las cuales un cebador se hibridará preferentemente con su subsecuencia diana, y en menor medida con, o no completamente con, otras secuencias.
Los cebadores pueden sintetizarse según los procedimientos que son bien conocidos en la técnica.
La selección del cebador puede realizarse utilizando varios procedimientos que son conocidos en la técnica (por ejemplo similares al diseño para utilizaciones convencionales de la RCP) incluyendo, por ejemplo, el diseñador de cebador universal después de enmascarar los elementos repetitivos de la secuencia genómica (Assembly NCBl 35, http://www.ensembl.org) utilizando Repeatmasker (http://www.repeatmasker.org).
En la primera reacción de amplificación descrita anteriormente, se utilizan cebadores por lo general que comprenden un cebador directo e inverso para cada secuencia de ácido nucleico que se amplía. Los pares de cebadores múltiples pueden combinarse en una sola reacción múltiple de modo que en la primera reacción de amplificación, se amplían múltiples secuencias de ácido nucleico (tales como todos los marcadores).
En la segunda reacción de amplificación tal como se describió también anteriormente, unas reacciones de amplificación semianidadas se realizan típicamente para cada secuencia de ácido nucleico específica que debe ampliarse. Los cebadores utilizados son de manera adecuada un cebador complementario tal como se utiliza en la primera reacción de amplificación en combinación con un cebador directo interno. Para algunas formas de realización de la presente invención resulta preferido que los cebadores utilizados sean iguales o sustancialmente iguales a los utilizados en la primera reacción de amplificación. Por lo general se utilizarán aproximadamente 0,15 \muM de cada cebador en la primera reacción de amplificación. Por lo general se utilizará aproximadamente 1 \muM de los cebadores directo interno y complementario adecuados para la segunda reacción de amplificación.
En una forma de realización de la presente invención, se utilizan varios pares de cebadores cada uno para una reestructuración cromosómica específica en una sola reacción. Cada par de cebadores da como resultado un producto de amplificación que es de diferente longitud y así los productos de la amplificación pueden diferenciarse.
En otra forma de realización de la presente invención, se utilizan cebadores marcados en los que cada par cebador está marcado con una etiqueta diferente y de este modo los productos de la amplificación pueden así diferenciarse.
Ventajosamente, pueden analizarse por consiguiente múltiples cambios de posición cromosómicos.
\vskip1.000000\baselineskip
Determinación del número de copias
Después de la segunda reacción de amplificación pueden analizarse los productos de amplificación de varias maneras para determinar el número de copias de las secuencias amplificadas.
A título de ejemplo, los productos de la amplificación pueden analizarse separando los productos amplificados utilizando la electroforesis con objeto de puntuar la presencia o ausencia del o de los productos de amplificación en cada alícuota de la muestra.
A título de ejemplo adicional, los resultados pueden puntuarse mediante análisis de la curva de fusión.
Los resultados pueden ser evaluados mediante evaluación visual del número de pocillos positivos. A título de ejemplo, si dos marcadores de ácido nucleico (A y B) se puntúan en la misma serie de 88 alícuotas, y si las cifras de alícuotas que puntúan positivo para cada marcador fueran 34 y 56 respectivamente, entonces las concentraciones medias de las dos secuencias pueden calcularse como 0,49 y 1,0 copias por alícuota, respectivamente. Por consiguiente, si la secuencia A se sabe que está presente en N copias por genoma, puede deducirse que la secuencia B está presente en 2N copias por genoma.
Si las moléculas de ácido nucleico se distribuyen al azar entre N alícuotas para dar una media de Z moléculas por alícuota entonces, según la distribución de Poisson, el número de alícuotas Np que cabe esperar que contengan por lo menos una molécula de ácido nucleico viene dado por la ecuación:
(i)Np=N(1-e^{-z})
Por el contrario, si en un panel de N alícuotas subgenómicas de ácido nucleico se determina la presencia de una secuencia dada, y si Np de estas puntuaciones de alícuotas positivas para la secuencia (es decir contiene por lo menos una copia de la secuencia), entonces el número medio de moléculas de la secuencia por alícuota puede calcularse de la manera siguiente:
(ii)Z=-ln(1-Np/N)
Por lo tanto, a partir del número de alícuotas que puntúan positivo para cualquier secuencia dada, puede determinarse la concentración de esta secuencia (expresada en copias por alícuotas). Si se analizan dos o más secuencias de esta manera en la misma serie (o series similares) de alícuotas de ácido nucleico, entonces pueden calcularse sus concentraciones relativas y por consiguiente su abundancia relativa.
\vskip1.000000\baselineskip
Identificación de alteraciones
En un aspecto adicional de la presente invención se proporciona un procedimiento de identificación de una o más alteraciones en una muestra de ácido nucleico, que comprende las etapas siguientes: (a) determinar el número de copias de una o más secuencias de ácido nucleico en una muestra de ácido nucleico según el procedimiento del primer aspecto de la presente invención; y (b) repetir de manera iterativa el procedimiento en resoluciones cada vez mayores.
Por consiguiente, el procedimiento del primer aspecto de la presente invención se repite de manera iterativa ampliando las secuencias de ácido nucleico que están espaciadas a intervalos cada vez más pequeños. Por lo general, puede obtenerse una fotografía en bruto de una alteración genómica utilizando los procedimientos ya conocidos en la técnica, tal como la hibridación fluorescente in situ (FISH). Dichos procedimientos pueden ser útiles para proporcionar una estimación del número de copias de las secuencias en un cromosoma específico en la proximidad de una alteración genómica, tal como, por ejemplo, un punto de inflexión. Sin embargo, para definir con mayor detalle la alteración genómica de interés puede utilizarse ventajosamente el procedimiento de la presente invención repitiéndolo de manera iterativa a resoluciones cada vez mayores. De este modo, por ejemplo, en una primera ronda, pueden utilizarse marcadores espaciados a intervalos de aproximadamente 0,2 a 0,5 Mb sobre aproximadamente 3,8 Mb en la zona del cromosoma en la que se ha encontrado anteriormente que se produce la alteración genética. Puede llevarse a cabo una ronda posterior utilizando marcadores a intervalos de aproximadamente 50 kb para mejorar más la supuesta alteración genómica hasta en aproximadamente 40 kb. Pueden realizarse todavía más rondas para localizar más la alteración genómica a aproximadamente 1 a 4 kb y a continuación a menos de 500 p.b. A dicha resolución fina, pueden utilizarse incluso procedimientos para identificar otras alteraciones genómicas, tales como deleciones en el lado centromérico de una transposición.
\vskip1.000000\baselineskip
Enfermedad
Se han identificado muchas zonas cromosómicas o genes específicos que están presentes en un número de copias alterado en las células enfermas. El número de copias de cualquier secuencia de ácido nucleico específica es por lo general de 2 en un individuo diploide, lo que refleja la presencia de una copia de una secuencia de ácido nucleico en cada cromosoma. Está ampliamente aceptado que los cambios del número de copias ocasionan cantidades anormales, o actividad, de las proteínas codificadas por estas zonas y por último el fenotipo de la enfermedad opcional.
En un aspecto, se proporciona un procedimiento de identificación de una o más alteraciones en una muestra de ácido nucleico, que comprende las etapas siguientes: (a) medir la frecuencia del número de copias de una o más secuencias de ácido nucleico en una primera muestra y una segunda muestra según el procedimiento del primer aspecto de la presente invención; (b) repetir iterativamente el procedimiento a resoluciones cada vez mayores para cada una de las muestras; y (c) identificar una o más diferencias en la frecuencia del número de copias de una o más secuencias de ácido nucleico en la primera y segunda muestras.
En una forma de realización preferida las muestras son o proceden de pacientes enfermos y sanos. En una forma de realización particularmente preferida, el ácido nucleico de la enfermedad es o procede de un paciente que padece cáncer. Por consiguiente, el procedimiento puede utilizarse para identificar una o más alteraciones entre un genoma de cáncer y un genoma normal.
La invención proporciona también un procedimiento de diagnóstico de una enfermedad en un paciente que padece o se sospecha que padece la enfermedad basado en la detección de los cambios en el número de las copias de un ácido nucleico. El paciente que está siendo examinado puede presentar síntomas de la enfermedad o síntomas que pueden estar asociados a la enfermedad. El paciente puede no presentar síntomas en absoluto pero puede en su lugar sospecharse que es sensible o está predispuesto a la enfermedad por antecedentes familiares o por el ensayos genéticos (p. ej. huellas dactilares genéticas), por ejemplo, como se describe en la presente memoria a continuación. El paciente puede ser un paciente que ha estado expuesto a uno o más agentes o condiciones que se sabe o que se sospecha que produce la enfermedad. El paciente puede incluso ser un paciente que está en proceso de desarrollar una enfermedad o sea sospechoso de desarrollarla. En un aspecto se proporciona un procedimiento de diagnóstico de una enfermedad en un paciente que padece o se sospecha que padece la enfermedad, que comprende las etapas siguientes: (a) medir la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra según el procedimiento del primer aspecto de la presente invención; y (b) comparar el número de copias de una o más secuencias de ácido nucleico con el número de copias normal (p. ej., sin enfermedad) de una o más secuencias de ácido nucleico; en la que la diferencia entre el número de copias es indicativo de que el paciente padece la enfermedad.
Por lo general, el número de copias normal se determinará analizando las muestras de un paciente o de varios pacientes que no padecen la enfermedad que está siendo analizada.
Una diferencia entre el número de copias de una o más secuencias de ácido nucleico en el paciente que está siendo analizado y el número de copias normal es indicativo de que está presente una alteración y de que el paciente padece la enfermedad.
Puede utilizarse incluso una muestra de numerosos individuos diferentes que se sabe que padecen una enfermedad común. Pueden llevarse a cabo ensayos de identificación para determinar la frecuencia del número de copias en numerosas secuencias de ácido nucleico diferentes para cada uno de los individuos enfermos con objeto de identificar las secuencias de ácido nucleico que tienen un número de copias alterado. Por ejemplo, para los individuos que presentan un tumor, puede extraerse una muestra de la zona tumoral de cada individuo y realizar identificaciones para identificar las zonas del genoma con un número de copias alterado. Con dicha información, pueden realizarse correlaciones entre las secuencias de ácido nucleico que presentan un número de copias alterado y las enfermedades específicas. Por consiguiente, los procedimientos de la presente pueden utilizarse para identificar la alteración de las secuencias de ácido nucleico, que están asociadas a enfermedades específicas.
Por lo tanto, en un aspecto adicional se proporciona también un procedimiento de diagnóstico de una enfermedad en un paciente que padece o se sospecha que padece la enfermedad se sabe que está predispuesto a la enfermedad (por ejemplo por antecedentes familiares o por el ensayos genéticos, tal como por huellas dactilares genéticas), ha estado expuesto a uno o más agentes o condiciones que se sabe o que se sospecha que produce la enfermedad o está en proceso o se sospecha que está en proceso de desarrollar la enfermedad que comprende las etapas siguientes: (a) medir la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra que se sabe que es la causa de la enfermedad o está asociada a ésta; y (b) comparar el número de copias de una o más secuencias de ácido nucleico en la muestra con la frecuencia del número de copias de una o más secuencias de ácido nucleico en la muestra con la frecuencia del número de copias de una o más secuencias de ácido nucleico en la muestra que se sabe que es la causa de la enfermedad o está asociada a ésta; en el que una correlación entre el número de copias es indicativo de que el paciente padece la enfermedad.
En una forma de realización, la enfermedad puede ser cáncer, tal como cáncer de riñón.
La presente invención proporciona además un procedimiento para detectar una o más alteraciones, tales como amplificaciones y/o deleciones, una o más muestras, tales como las muestras que son o proceden de células tumorales. Los resultados que se obtienen pueden utilizarse para determinar el comportamiento ulterior de la muestra. La determinación puede realizarse asociando los modelos de alteraciones en la muestra con el comportamiento de la muestra. Dichas asociaciones pueden realizarse analizando, por ejemplo, el ADN de las muestras archivadas relacionado con registros médicos, o cuando se analizan muestras recientes por los procedimientos descritos en la presente memoria y los pacientes a los que se hace el seguimiento.
Otro aspecto de la presente invención consiste en proporcionar un procedimiento de análisis de células procedentes de una célula o tejido anormal sospechoso, en una etapa preliminar del desarrollo. Una ventaja de los procedimientos descritos en la presente memoria es que solamente se requiere para el análisis una pequeña cantidad de ácido nucleico genómico. La detección precoz de las alteraciones, tal como las amplificaciones y/o deleciones, en dichas células o tejidos permite la intervención terapéutica precoz que puede adaptarse a las reestructuraciones genéticas. Además, dicha detección precoz proporciona medios para asociar la evolución de las células o tejidos a las reestructuraciones genéticas detectadas por los procedimientos de la presente invención.
Utilizando estos procedimientos pueden llevarse a cabo identificaciones rápidamente y con poco coste. Por consiguiente, los procedimientos pueden ser muy aconsejables para el desarrollo de perfiles de patología molecular que permite a los doctores hacer pronósticos más informados del paciente y predecir mejor la respuesta del paciente a diferentes terapias, mejorando de este modo los resultados clínicos.
Para los pacientes que presentan síntomas de una enfermedad, el procedimiento descrito en la presente memoria puede utilizarse también para determinar si el paciente tiene alteraciones del número de copias que son conocidas porque están relacionadas con enfermedades que están asociadas a los síntomas que presenta el paciente. Por ejemplo, para un paciente que tiene un tumor, un doctor obtendría una muestra del tumor. La identificación de la muestra del tumor para identificar si existe una alteración del número de copias en las secuencias de ácido nucleico conocidas por estar asociadas al tipo de tumor específico puede llevarse a cabo rápidamente utilizando los procedimientos descritos en la presente memoria. Con la información específica con respecto a las alteraciones del número de copias y el conocimiento de las correlaciones entre los resultados de la enfermedad y la eficacia de diferentes estrategias de tratamiento para la o las alteraciones específicas, el doctor puede tomar una decisión documentada con relación al pronóstico del paciente y la opción más eficaz de tratamiento. Por ejemplo, si los procedimientos demuestran que se amplían unas secuencias específicas de ácido nucleico y que la amplificación de este locus está asociada a la escasa recuperación, el doctor puede aconsejar al cliente con respecto a la probable eficacia las opciones de tratamiento agresivo y la opción de llevar a cabo simplemente dichos tratamientos, especialmente si la enfermedad está muy avanzada. Por otra parte, si el número de copias está alterado en un locus que está asociado a la buena recuperación, el doctor puede describir un intervalo de opciones de tratamiento que varía desde simplemente controlar la enfermedad para ver si la enfermedad empeora o medidas más agresivas para asegurar que la enfermedad es atacada antes de que empeore.
De este modo, en un aspecto adicional, se proporciona un procedimiento para determinar si un paciente presenta una o más alteraciones del número de copias que es conocido porque está relacionado con una enfermedad, que comprende la etapa de identificar si existe una alteración del número de copias utilizando el procedimiento según el primer aspecto de la invención en una o más secuencias de ácido nucleico que se sabe que están asociadas a la enfermedad que se sospecha que está padeciendo el paciente, en la que una correlación entre la alteración del número de copias en el paciente y la alteración del número de copias en la enfermedad indica que el paciente está padeciendo la enfermedad.
\vskip1.000000\baselineskip
Cáncer
Los términos "tumor" o "cáncer" se refieren a la presencia de células que poseen características típicas de células productoras de cáncer, tales como la proliferación incontrolada, inmortalidad, potencial metastásico, rápido crecimiento y velocidad de proliferación, y determinadas propiedades morfológicas características.
Con frecuencia, las células cancerosas estarán en forma de tumor, pero dichas células pueden existir solas en un animal, o pueden ser células cancerosas no tumorígenas, tales como las células de leucemia.
Los cánceres incluyen, pero no se limitan a melanomas, cáncer de mama, cáncer de pulmón, cáncer de bronquios, cáncer colorrectal, cáncer de próstata, cáncer de páncreas, cáncer de estómago, cáncer de ovario, cáncer de vejiga urinaria, cáncer cerebral o del sistema nervioso central, cáncer del sistema nervioso periférico, cáncer de esófago, cáncer cervical, cáncer de útero o de endometrio, cáncer de cavidad oral o de faringe, cáncer de hígado, cáncer de riñón, cáncer de testículo, cáncer del conducto biliar, cáncer del intestino delgado o de apéndice, cáncer de las glándulas salivales, cáncer de la glándula tiroides, cáncer de las glándulas suprarrenales, osteosarcoma, condriosarcoma y similares.
\newpage
Los tumores pueden ser de cariotipos heterogéneos que contienen varias poblaciones de células cada con diferentes tipos de reestructuraciones genéticas. Las células tumorales son difíciles de cultivar, y no está claro que las células cultivadas sean representativas de la población original de células tumorales. La presente invención proporciona unos medios para evitar el obstáculo del cultivo ya que solamente se requieren bajas cantidades de ácido nucleico y por consiguiente permite la caracterización genética de células tumorales y de este modo, de la heterogeneidad de los tumores.
La extracción de la mayor parte del ácido nucleico de muchas células de un tumor puede utilizarse también para determinar las alteraciones consistentes en un tumor.
En un aspecto adicional de la presente invención, se proporciona un procedimiento para detectar, diagnosticar o determinar la sensibilidad de un sujeto al cáncer que comprende la etapa de determinar la presencia de la transposición t(3;5) no recíproca como se describe en la presente memoria en un paciente, en el que la presencia de la transposición es indicativa de que el paciente tiene, es probable que tenga o está predispuesto a desarrollar cáncer. Preferentemente, el cáncer es el adenocarcinoma renal.
\vskip1.000000\baselineskip
Aplicaciones adicionales
Los procedimientos descritos en la presente memoria proporcionan ventajosamente una manera rápida, precisa y económica de determinar la frecuencia del número de copias de una o más secuencias de ácido nucleico. Esto convierte en ideales a los procedimientos de análisis molecular de numerosas enfermedades, así como la evaluación de desequilibrios cromosómicos asociados, por ejemplo, a síndromes que amenazan la salud.
\vskip1.000000\baselineskip
Pronóstico
Los procedimientos descritos en la presente memoria pueden utilizarse para desarrollar correlaciones entre determinados fenotipos de enfermedades y pronósticos para los pacientes. Por ejemplo, pueden utilizarse procedimientos para identificar numerosos ácidos nucleicos en una variedad de diferentes pacientes que tienen los mismos síntomas aparentes de enfermedad para identificar estos ácidos nucleicos que tienen un número de copias anómalas. En este caso, se obtendrían muestras a partir del tejido enfermo. Puede mantenerse un historial sanitario para cada individuo de la prueba para hacer una correlación entre los ácidos nucleicos con número de copias alteradas y las respuestas de la enfermedad.
De esta manera, pueden hacerse correlaciones entre los cambios de número de copias y el pronóstico del paciente.
Por lo tanto, en otro aspecto se proporciona también un procedimiento para determinar el pronóstico del paciente que comprende las etapas siguientes: (a) determinar la frecuencia del número de copias de uno o más ácidos nucleicos procedentes de uno o más pacientes que presentan los mismos síntomas de enfermedad aparentes que el paciente que utiliza el procedimiento según el primer aspecto de la presente invención; (b) identificar aquellos ácidos nucleicos que tienen un número de copias anómalo; (c) correlacionar los ácidos nucleicos que tienen un número de copias alterado con la respuesta de la enfermedad; y (d) preveer la respuesta de la enfermedad en el paciente.
\vskip1.000000\baselineskip
Estrategias del tratamiento óptimo
Los procedimientos descritos en la presente memoria puede aplicarse de manera rutinaria antes de administrar un fármaco a un paciente por primera vez. Si el paciente se observa que pierde ambas copias de un gen que expresa una enzima requerida para la desintoxicación de un fármaco específico, generalmente no debería administrarse el fármaco al paciente o, debería administrarse el fármaco en dosis más pequeñas en comparación con los pacientes que presentan concentraciones normales de la enzima. El curso posterior puede ser necesario si no hay ningún tratamiento alternativo disponible. Si se observa que el paciente pierde ambas copias de un gen que expresa una enzima requerida para la activación de un fármaco específico, el fármaco no tendrá ningún efecto beneficioso en el paciente y no debería administrarse. A los pacientes con una copia natural de un gen y una copia mutante de un gen, y a quienes están en situación de riesgo de tener menores niveles de una enzima, se les debe administrar fármacos metabolizados por esta enzima únicamente con el mismo cuidado, dependiendo de nuevo de si existen alternativas disponibles. Si el fármaco está desintoxicado por la enzima en cuestión, debería administrarse al paciente en general una dosis menor del fármaco. Si el fármaco es activado por la enzima, debería administrarse al paciente heterocigótico una dosis mayor del fármaco. Lo contrario aplica a pacientes con copias adicionales de un gen de biotransformación específica, quienes están en situación de riesgo de tener concentraciones elevadas de una enzima. La selección más racional de agentes terapéuticos que pueden prepararse con la utilidad de resultados de identificación con menos efectos secundarios y mayor eficacia del fármaco en pacientes con poca metabolización.
Los procedimientos pueden ser útiles también para identificar poblaciones de pacientes quienes van a ser sometidos a una prueba clínica de un nuevo fármaco. El examen identifica un grupo de pacientes, cada uno de los cuales presenta concentraciones naturales del complemento completo de enzimas de biotransformación. El grupo de pacientes a continuación se somete a la determinación de la seguridad y la eficacia de los fármacos. Los fármacos que demuestran ser eficaces mediante dichas pruebas son formulados para su utilización terapéutica con un vehículo farmacéutico tal como agua destilada estéril, solución salina fisiológica, solución de Ringer, solución de dextrosa y solución de Hank.
\vskip1.000000\baselineskip
Sensibilidad la enfermedad
Los procedimientos descritos en la presente memoria pueden utilizarse también para identificar individuos que se sabe que son sensibles a una enfermedad. En este escenario, por ejemplo, el individuo conocería los resultados de la prueba o los antecedentes familiares que presentan la presencia de un marcador de la enfermedad que era sensible a una enfermedad específica. Se extraería una muestra de tejido, que está asociado a la enfermedad a la que un paciente es sensible. A título de ejemplo solamente, si el paciente procede de una familia con antecedentes de cáncer de piel, un doctor realizaría una biopsia de la piel para obtener la muestra. Puede determinarse entonces un valor de la frecuencia del número de copias del locus o de los loci asociados a la enfermedad específica a la que el paciente es sensible utilizando los procedimientos descritos en la presente memoria. Si la determinación presenta un número anormal de copias, el paciente puede entonces ser aconsejado con respecto a la probabilidad de que el paciente comience a padecer la enfermedad y los pros y contras con respecto a diferentes tratamientos alternativos. En este caso en el que el paciente todavía no está presentando síntomas de la enfermedad, la acción más apropiada puede ser simplemente controlar estrechamente al paciente. Sin embargo, el paciente, tras el consejo apropiado, puede elegir tomar la acción agresiva preventiva para evitar problemas en una fecha posterior.
\vskip1.000000\baselineskip
Sin síntomas de enfermedad ni conocidos que sean sensibles a la enfermedad
Los procedimientos descritos en la presente memoria también pueden ser útiles para identificar individuos, que no presentan síntomas de enfermedad ni sensibilidades conocidas, a la enfermedad. Un individuo en esta categoría generalmente no presentaría síntomas de enfermedad, no tendría antecedentes familiares de la enfermedad y no tendría conocimiento de que transporta un marcador asociado a una enfermedad. En tales casos, pueden utilizarse procedimientos como una herramienta de identificación preventiva. En este aspecto, un número de locus seleccionados conocidos por estar asociados con determinadas enfermedades puede examinarse para identificar locus con un número de copias atípico. En este caso, se obtendrían muestras de diferentes tejidos o fluidos que están afectados por la(s) enfermedad(es) que se está(n) examinando. Si se identifica que un o unos locus presentaban un número de copias alterado, entonces se aconsejaría al paciente respecto a la probabilidad de que la enfermedad se manifieste y el intervalo de opciones de tratamiento disponibles.
\vskip1.000000\baselineskip
Diagnóstico prenatal
Otra utilización de los procedimientos descritos se sitúa en el área de los diagnósticos prenatales, en particular, como un modo de identificar anomalías del número de copias en un embrión o feto. Una tendencia general en aumento es para las mujeres que esperan hasta más tarde en la vida para tener niños. Asociado a este retraso, está el riesgo creciente de que el niño nazca con un defecto congénito de nacimiento.
Los procedimientos para obtener ácido nucleico de células embrionarias (es decir, el recién nacido en desarrollo desde la concepción hasta 8 semanas de desarrollo) o fetales (es decir, el recién nacido en desarrollo desde nueve semanas de desarrollo hasta el nacimiento) son bien conocidas en la técnica. Los ejemplos incluyen pero no se limitan a la biopsia materna (por ejemplo, muestreo cervical, muestreo de amniocentesis, muestreo de sangre), biopsia fetal (por ejemplo, biopsia hepática) y muestreo de la vellosidad coriónica (patente US nº 6.331.395).
El aislamiento del ácido nucleico fetal procedente de la sangre materna se utiliza preferentemente según este aspecto de la presente invención ya que es un procedimiento no agresivo que hace que no plantee ningún riesgo para el recién nacido en desarrollo (Am, J. Hum. Genet. (1998) 62(4): 768-75). Las células exentas de ácido nucleico fetal pueden recogerse de la circulación materna y analizarse tal como se describió anteriormente (Am. J. Obstet. Gynecol. (2002) 186:117-20). Las técnicas de la RCP se utilizan por lo general junto con estos procedimientos con objeto de aumentar la cantidad relativa de ácido nucleico fetal y permitir de este modo el análisis.
\vskip1.000000\baselineskip
Ácido nucleico
La expresión "ácido nucleico" tal como se utiliza en la presente memoria se refiere a un desoxirribonucleótido o ribonucleótido en forma mono- o bicatenaria.
La expresión comprende los ácidos nucleico, es decir, oligonucleótidos, que contienen análogos conocidos de nucleótidos naturales que presentan propiedades de fijación similares o mejoradas. La expresión comprende también estructuras similares al ácido nucleico con ejes centrales sintéticos. Los análogos con eje central de ADN incluyen fosfodiéster, fosforotioato, fosforoditioato, metilfosfonato, fosforamidato, fosfotriéster de alquilo, sulfamato, 3'-tioacetal, metilen(metilimino), 3'-N-carbamato, carbamato de morfolino, y ácidos nucleicos peptídicos (ANP); véase Oligonucleotides and Analogues, a Practical Approach, editado por F. Eckstein, IRL Press en Oxford University Press (1991); Antisense Strategies, Annals of the New York Academy of Sciences, Volumen 600, Eds. Baserga y Denhardt (NYAS 1992); Milligan (1993) J. Med. Chem. 36:1923-1937; Antisense Research and Applications (1993, CRC Press). Los ANP contienen ejes centrales no iónicos, tales como las unidades de N-(2-aminoetil)glicina. Los enlaces fosforotioato se describen en los documentos WO 97/03211; WO 96/39154; Mata (1997) Toxicol. Appl. Pharmacol. 144:189-197. Otros ejes centrales sintéticos comprendidos en el término incluyen los enlaces metilfosfonato o los enlaces alternativos metilfosfonato y fosfodiéster (Strauss-Soukup (1997) Biochemistry 36: 8692-8698), y los enlaces bencilfosfonato (Samstag (1996) Antisense Nucleic Acid Drug Dev 6:153-156).
El ácido nucleico puede ser ADN o ARN de origen genómico, sintético o recombinante por ejemplo ADNc. El ácido nucleico puede ser bicatenario o monocatenario si representa la cadena transcrita complementaria o combinaciones de la misma.
Preferentemente, el ácido nucleico es ADN, más preferentemente ADN genómico.
El ácido nucleico puede prepararse mediante la utilización de técnicas de ADN recombinante (por ejemplo ADN recombinante).
En un aspecto de la presente invención se proporciona un ácido nucleico aislado que codifica un transposición t(3;5) no recíproca, en la que el cromosoma 5q21.3 para la coordenada 105386443 p.b. se fusiona al cromosoma 3p13 de coordenada 74111893 p.b. y en el que el resto de adenina en la unión es de uno de los dos cromosomas.
Preferentemente, el cromosoma 5q21.3 comprende la secuencia TATACATACATACGGATATATGTATAAAATC o una variante, desviación homóloga o fragmento de la misma.
Preferentemente, el cromosoma 3p13 comprende la secuencia TAGGGAGTGAAGTAGTGGCCAAGAAAACAT GCCAG o una variante, desviación homóloga o fragmento de la misma.
Preferentemente, la transposición t(3;5) no recíproca comprende la secuencia TATACATACATACGGATATATG TATAAAATCATAGGGAGTGAAGTAGTGGCCAAGAAAACATGCCAG o una variante, desviación homóloga o fragmento de la misma.
\vskip1.000000\baselineskip
Montajes
El ácido nucleico correspondiente a la alteración identificada por los procedimientos de la presente invención puede clonarse y ligarse en un montaje.
El término "montaje" (que es sinónimo a los términos tales como "conjugado", "casete" e "híbrido") incluye una secuencia nucleotídica unida directa o indirectamente a un activador.
El montaje puede contener o expresar un marcador, que permite la selección del montaje de la secuencia nucleotídica de una célula, tal como una célula bacteriana, vegetal o de mamífero. Existen varios marcadores que pueden utilizarse, por ejemplo los que codifican la manosa-6-fosfato isomerasa (especialmente para plantas) o los marcadores que proporcionan resistencia a antibióticos, por ejemplo resistencia a G418, higromicina, bleomicina, kanamicina y gentamicina.
\vskip1.000000\baselineskip
Vectores
El ácido nucleico correspondiente a la alteración identificada por los procedimientos de la presente invención puede clonarse y ligarse en un vector.
El término "vector" incluye vectores de expresión, vectores de transformación y vectores lanzadera.
La expresión "vector de transformación" significa un montaje capaz de ser transferido desde una entidad a otra entidad, que puede ser de la especie o puede ser de una especie diferente. Si el montaje es capaz de transferirse desde una especie a otra, por ejemplo desde un plásmido de E. coli a una bacteria, tal como del género Bacillus, entonces el vector de transformación se denomina a veces "vector lanzadera". Puede ser incluso un montaje capaz de transferirse desde un plásmido de E. coli a un Agrobacterium a una planta.
Los vectores pueden transformarse en una célula hospedadora adecuada tal como se describe a continuación para proporcionar la expresión de un polipéptido.
Los vectores pueden ser por ejemplo vectores de plásmido, de virus o de fago proporcionados con un origen de replicación, opcionalmente un activador para la expresión de dicho polinucleótido y opcionalmente un regulador del activador.
Los vectores pueden contener una o más secuencias nucleotídicas de marcador seleccionable. Los sistemas de selección más adecuados para microorganismos industriales son los formados por el grupo de marcadores de selección que no necesitan una mutación en el organismo hospedador. Los ejemplos de marcadores de selección no micóticos son las secuencias nucleotídicas para acetamidasa (amdS), ATP sintetasa, subunidad 9 (oliC), orotidina-5'-fosfato-descarboxilasa (pvrA), resistencia a la fleomicina y benomilo (benA). Ejemplos de marcadores de selección no micóticos son la secuencia nucleotídica con resistencia a G418 bacteriana (ésta puede utilizarse también en levaduras, pero no en hongos filamentosos), la secuencia nucleotídica con resistencia a la ampicilina (E. coli), la secuencia nucleotídica con resistencia a la neomicina (Bacillus), y la secuencia nucleotídica uidA de E. coli, que codifica la \beta-glucuronidasa (GUS).
Los vectores pueden utilizarse in vitro, por ejemplo para la producción de ARN o utilizarse para transfectar o transformar una célula hospedadora.
De este modo, los polinucleótidos pueden incorporarse en un vector recombinante (por lo general un vector replicable), por ejemplo, un vector de clonación o expresión. El vector puede utilizarse para replicar el ácido nucleico en una célula hospedadora compatible.
\vskip1.000000\baselineskip
Variantes/homólogos/derivados/fragmentos
La presente invención comprende la utilización de variantes, homólogos, derivados y fragmentos de los mismos.
El término "variante" se utiliza para significar un polipéptido natural o secuencias nucleotídicas que difieren de una secuencia natural.
El término "fragmento" indica que una secuencia polipeptídica o nucleotídica comprende una fracción de una secuencia natural. Puede comprender una o más secciones contiguas grandes de secuencia o muchas secciones pequeñas. La secuencia puede también comprender otros elementos de la secuencia, por ejemplo, puede ser una proteína de fusión con otra proteína. Preferentemente la secuencia comprende por lo menos 50%, más preferentemente por lo menos 65%, más preferentemente por lo menos 80%, más preferentemente por lo menos 85%, más preferentemente por lo menos 90%, más preferentemente por lo menos 95%, más preferentemente por lo menos 96%, más preferentemente por lo menos 97%, más preferentemente por lo menos 98%, más preferentemente por lo menos 99% de la secuencia natural.
Preferentemente el fragmento conserva el 50%, más preferentemente el 60%, más preferentemente el 70%, más preferentemente el 80%, más preferentemente el 85%, más preferentemente el 90%, más preferentemente el 95%, más preferentemente el 96%, más preferentemente el 97%, más preferentemente por lo menos 98% o más preferentemente el 99% de actividad de la secuencia polipeptídica o nucleotídica natural.
El fragmento puede ser un fragmento funcional.
Por "fragmento funcional" de una molécula se entiende un fragmento que conserva o posee sustancialmente la misma actividad biológica que la molécula intacta. En todos los casos, un fragmento funcional de una molécula conserva por lo menos el 10% y por lo menos aproximadamente el 25%, 50%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% o 99% de la actividad biológica de la molécula intacta.
El termino "homólogo" significa una entidad que tiene una determinada homología con las presentes secuencias de aminoácido y las presentes secuencias nucleotídicas. Aquí, el término "homología" puede equivaler a "identidad".
En el presente contexto, una secuencia homóloga se considera que incluye una secuencia de aminoácidos, que puede ser por lo menos 75, 85 o 90% idéntica, preferentemente por lo menos 95%, 96%, 97%, 98% o 99% idéntica a la presente secuencia. Aunque homología puede considerarse también desde el punto de vista de similitud (es decir restos de aminoácidos con propiedades/funciones químicas similares), en el contexto de la presente invención se prefiere expresar homología en términos de identidad de secuencia.
En el presente contexto, una secuencia homóloga se considera que incluye una secuencia de nucleótidos, que puede ser por lo menos 75, 85 o 90% idéntica, preferentemente por lo menos 95%, 96%, 97%, 98% o 99% idéntica a la presente secuencia. Aunque homología puede considerarse también desde el punto de vista de similitud (es decir restos de aminoácidos con propiedades/funciones químicas similares), en el contexto de la presente invención se prefiere expresar homología en términos de identidad de secuencia.
Las comparaciones de homología pueden realizarse visualmente, o más frecuentemente, con la ayuda de programas de comparación de secuencias fácilmente disponibles. Estos programas informáticos comercialmente disponibles pueden calcular el % de homología entre dos o más secuencias.
El % de homología puede calcularse sobre secuencias contiguas, es decir una secuencia está alineada con otra secuencia y cada aminoácido en una secuencia se compara directamente con el aminoácido correspondiente en otra secuencia, un resto a la vez. Esto se denomina una alineación "sin huecos". Por lo general, dichas alineaciones sin huecos se realizan solamente sobre un número relativamente pequeño de restos.
Aunque este es un procedimiento muy sencillo y consecuente, no puede tener en consideración que, por ejemplo, en un par de secuencias de otro modo idénticas, una inserción o deleción ocasionará que los siguientes restos de aminoácidos se coloquen fuera de la alineación, resultando de este modo potencialmente una gran reducción en el % de homología cuando se lleva a cabo una alineación global. En consecuencia, la mayoría de los métodos de comparación de secuencias se diseñan para producir alineaciones óptimas que tengan en consideración posibles inserciones y deleciones sin penalizar indebidamente la puntuación global de la homología. Esto se consigue insertando "huecos" en la alineación de la secuencia para tratar de maximizar la homología local.
Sin embargo, estos procedimientos más complejos asignan "penalizaciones por hueco" a cada hueco que se produce en la alineación de modo que, para el mismo número de aminoácidos idénticos, una alineación de la secuencia con tan pocos huecos como sea posible (reflejando mayor relatividad entre las dos secuencias comparadas) conseguirá una puntuación mayor que la que tiene muchos huecos. Los "costes por hueco afines" se utilizan por lo general para cargar un coste relativamente elevado por la existencia de un hueco y una penalización más pequeña para cada resto posterior en el hueco. Este es el sistema de puntuación de hueco más generalmente utilizado. Altas penalizaciones por hueco desde luego producirán alineaciones optimizadas con menores huecos. La mayoría de los programas de alineación permiten que se modifiquen las penalizaciones por hueco. Sin embargo, resulta preferido utilizar los valores por defecto cuando se utiliza dicho programa para comparaciones de secuencias. Por ejemplo, cuando se utiliza el paquete GCG Wisconsin Bestfit la penalización por hueco por defecto para secuencias de aminoácidos es -12 para un hueco y -4 para cada extensión.
El cálculo del % de homología máximo por consiguiente requiere en primer lugar la producción de una alineación óptima, teniendo en consideración las penalizaciones por hueco. Un programa de ordenador adecuado para llevar a cabo dicha alineación es el paquete GCG Wisconsin Bestfit (University of Wisconsin, EE.UU.; Devereux et al., 1984, Nucleic Acids Research 12:387). Los ejemplos de otro programa que pueden realizar comparaciones de secuencias incluyen, pero se limitan, al paquete BLAST (véase Ausubel et al., 1999 ibid - Capítulo 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410), el GENEWORKS continuación de herramientas de comparación y CLUSTAL. Tanto BLAST como FASTA están disponibles para investigación fuera de línea y en línea (véase Ausubel el al., 1999 ibid páginas 7-58 a 7-60). Sin embargo, para algunas aplicaciones, es preferible utilizar el programa Bestfit GCG. Una nueva herramienta, denominada BLAST 2 Sequences está también disponible para comparar secuencias de proteínas y nucleótidos (véase FEMS MIcrobio Left 1999 174(2): 247-5; FEMS MIcrobio Left 1999 177(1): 187-8).
Aunque el % de homología final puede medirse en términos de identidad, el propio proceso de alineación no está basado por lo general en una comparación de pares todo o nada. En su lugar, se utiliza generalmente una matriz de puntuación de similitud a escala que asigna puntuaciones a cada comparación en forma de pares basada en la similitud química o la distancia en la evolución. Un ejemplo de dicha matriz generalmente utilizada es la matriz BLOSUM62, la matriz por defecto para la continuación de programas BLAST. Los programas Winsconsin de GCG generalmente utilizan valores públicos por defecto o la tabla de comparación de símbolos habitual si se suministra (véase el manual de usuario para más detalles). Para algunas aplicaciones, resulta preferido utilizar los valores públicos por defecto para el paquete de GCG, o en el caso de otro programa informático, la matriz por defecto, tal como BLOSUM62.
Una vez el programa informático ha producido la alineación óptima, es posible calcular el % de homología, preferentemente el % de identidad de secuencia. El programa informático por lo general forma parte de la comparación de secuencias y genera un resultado numérico.
Deberían utilizarse penalizaciones por hueco cuando se determina la identidad de secuencia, preferentemente entonces se utilizan los siguientes parámetros:
1
2
Para la comparación de secuencias polipeptídicas pueden utilizarse los escenarios siguientes: penalización por creación de HUECO de 3,0 y penalización de 0,1 por amplificación de HUECO. De manera adecuada, el grado de identidad con respecto a una secuencia de aminoácidos se determina sobre por lo menos 5 aminoácidos contiguos, se determina sobre por lo menos 10 aminoácidos contiguos, sobre por lo menos 15 aminoácidos contiguos, sobre por lo menos 20 aminoácidos contiguos, sobre por lo menos 30 aminoácidos contiguos, sobre por lo menos 40 aminoácidos contiguos, sobre por lo menos 50 aminoácidos contiguos o sobre por lo menos 60 aminoácidos contiguos.
Las secuencias pueden tener también deleciones, inserciones o sustituciones de restos de aminoácidos, que producen un cambio imperceptible y dan como resultado una sustancia funcionalmente equivalente. Las sustituciones deliberadas de aminoácidos pueden realizarse basándose en la similitud de polaridad, carga, solubilidad, hidrofobia, hidrofilia y/o la naturaleza amfipática de los restos siempre que se conserve la actividad de fijación secundaria de la sustancia. Por ejemplo, los aminoácidos cargados negativamente incluyen el ácido aspártico y el ácido glutámico; los aminoácidos cargados positivamente incluyen la lisina y la arginina; y los aminoácidos con grupos de cabeza polares sin carga que presentan valores de hidrofilia similares incluyen la leucina, isoleucina, valina, glicina, alanina, asparagina, glutamina, serina, treonina, fenilalanina y tirosina.
Pueden realizarse sustituciones conservadores, por ejemplo, según la tabla a continuación. Los aminoácidos en el mismo bloque en la segunda columna y preferentemente en la misma línea en la tercera columna pueden sustituirse unos por otros:
3
La presente invención comprende también la sustitución homóloga (sustitución y reemplazamiento se utilizan ambas en la presente memoria para significar el intercambio de un resto de aminoácido existente, por un resto alternativo) puede producirse es decir la sustitución semejante por semejante, tal como básico por básico, ácido por ácido, polar por polar, etc. La sustitución no homóloga puede producirse también es decir en una clase de resto a otra o alternativamente implicando la inclusión de aminoácidos artificiales, tales como ornitina (denominada en lo sucesivo Z), ácido diaminobutírico ornitina ((denominada en adelante B), norleucina ornitina (denominada en lo sucesivo O), pirilalanina, tienilalanina, naftilalanina y fenilglicina.
Los reemplazamientos pueden ser realizados también por aminoácidos artificiales e incluyen; aminoácidos alfa* y alfa-disustituidos* N-alquil aminoácidos*, ácido láctico*, derivados haluro de aminoácidos naturales, tal como trifluorotirosina*, p-Cl-fenilalanina*, p-Br-fenilalanina*, p-I-fenilalanina*, L-alil-glicina*, \beta-alanina*, ácido L-\alpha-aminobutírico*, L-\gamma-aminobutírico*, ácido L-\alpha-aminoisobutírico*, ácido L-\varepsilon-aminocaproico^{#}, ácido 7-aminoheptanoico*, L-metionina sulfona^{#*}, L-norleucina*, L-norvalina*, p-nitro-L-fenilalanina*, L-hidroxipolina^{#}, L-tioprolina*, derivados metílicos de fenilalanina (Phe), tales como 4-metil-Phe*, pentametil-Phe*, L-Phe (4-amino)^{#}, L-Tyr (metil)*, L-Phe(4-isopropil)*, L-Tic(ácido 1, 2, 3, 4-tetrahidroisoquinolina-3-carboxilo)*, ácido L-diaminopropiónico^{#} y L-Phe (4-bencil)*. La anotación * se ha utilizado en aras de la exposición anterior (en relación con la sustitución homóloga o no homóloga), para indicar la naturaleza hidrófoba del derivado mientras que # se ha utilizado para indicar la naturaleza hidrófila del derivado, #* indica características amfipáticas.
Las secuencias de aminoácidos variantes pueden incluir grupos espaciadores adecuados que pueden insertarse entre cualquiera de dos restos de aminoácido de la secuencia incluyendo grupos alquilo (tales como los grupos metilo, etilo o propilo) además de espaciadores de aminoácidos, tales como los restos de glicina o \beta-alanina. Una forma adicional de variación conlleva la presencia de uno o más restos de aminoácidos en forma peptoide y será bien comprendida por los expertos en la materia. Para evitar dudas, "la forma peptoide" se utiliza para referirse a restos variantes de aminoácidos en los que el grupo sustituyente \alpha-carbono está en el átomo de nitrógeno del resto en lugar de en el carbono \alpha. Los procedimientos para preparar péptidos en forma peptoide son conocidos en la técnica, por ejemplo Simon R.J. et al., PNAS (1992) 89(20), 9367-9371 y Horwell D.C., Trends Biotechnol. (1995) 13(4), 132-134.
Las secuencias nucleotídicas para su utilización en la presente invención pueden incluir en ellas nucleótidos sintéticos o modificados en la técnica se conocen numerosos tipos diferentes de modificación a oligonucleótidos. Éstas incluyen los ejes centrales de fosfonato de metilo y de fosforotioato y/o la adición de cadenas de acridina o polilisina en los extremos 3' y/o 5' de la molécula. En aras de la presente invención, debe sobreentenderse que las secuencias nucleotídicas pueden ser modificadas por cualquier procedimiento disponible en la técnica. Dichas modificaciones pueden realizarse para aumentar la actividad in vivo de la vida útil de las secuencias nucleotídicas útiles en la presente invención.
\vskip1.000000\baselineskip
Kits
Los materiales para su utilización en los procedimientos de la presente invención son apropiados teóricamente para la preparación de kits.
Dicho kits puede comprender recipientes, cada uno con uno o más de varios reactivos (por lo general en forma concentrada) utilizados en los procedimientos de la presente invención que están descritos en la presente memoria, incluyendo, por ejemplo, tampones y los trifosfatos de nucleótido apropiado (por ejemplo, dATP, dCTP, dGTP y dTTP; o rATP, rCTP, rGTP y UTP), ADN polimerasa y pueden incluirse también uno o más cebadores para su utilización en la presente invención.
Los oligonucleótidos en recipientes pueden estar en cualquier forma, por ejemplo, liofilizados o en solución (por ejemplo, agua destilada o solución tamponada), etc. Los oligonucleótidos listos para su utilización en la misma reacción de amplificación pueden combinarse en un solo recipiente o pueden estar en recipientes separados.
El kit opcionalmente comprende además un ácido nucleico de referencia.
Se incluirán también por lo general una serie de instrucciones.
\vskip1.000000\baselineskip
Aspectos adicionales
En un aspecto adicional, se proporciona un procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprenden las etapas siguientes: (a) proporcionar una o más alícuota(s) de la muestra, en la que cada alícuota comprende ácido nucleico en una cantidad inferior a un genoma por alícuota; (b) ampliar una o más secuencias de ácido nucleico en la(s) alícuota(s) en una primera reacción de amplificación; (c) ampliar en una segunda reacción de amplificación dos o más secuencias de ácido nucleico procedentes de la(s) alícuota(s) preparada(s) según la etapa (b), en la que por lo menos una de las secuencias de ácido nucleico es un marcador de prueba y por lo menos una de las secuencias de ácido nucleico es un marcador de referencia; y (d) calcular el número de copias del marcador de prueba comparando el número de productos amplificados para el marcador de prueba con los del marcador de referencia.
En un aspecto adicional, se proporciona un procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes:
(a)
proporcionar una o más alícuota(s) de la muestra, en la que cada alícuota comprende ácido nucleico en una cantidad inferior a un genoma por alícuota; (b) ampliar un marcador de prueba en cada alícuota(s) en una primera reacción de amplificación; (c) dividir cada uno de los productos amplificados procedentes de la primera reacción de amplificación en por lo menos dos alícuotas de la réplica; (d) ampliar en una segunda reacción de amplificación un marcador de prueba en por lo menos una alícuota o unas de las alícuotas de la réplica preparadas según la etapa (c); y (d) calcular el número de copias comparando el número de productos amplificados procedentes de la segunda reacción de amplificación para el marcador de prueba con los de un marcador de referencia.
\vskip1.000000\baselineskip
En un aspecto adicional, se proporciona un procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes:
(a)
proporcionar una o más alícuota(s) de la muestra, en la que cada alícuota comprende ácido nucleico en una cantidad inferior a un genoma por alícuota; (b) ampliar un marcador de prueba en cada alícuota(s) en una primera reacción de amplificación; (c) dividir cada uno de los productos amplificados procedentes de la primera reacción de amplificación en por lo menos dos alícuotas de la réplica; (d) ampliar en una segunda reacción de amplificación el marcador de prueba procedente de una primera alícuota de la réplica y el marcador de referencia procedente de una segunda alícuota de la réplica preparadas según la etapa (c); y (e) calcular el número de copias comparando el número de productos amplificados para el marcador de prueba y el marcador de referencia.
\vskip1.000000\baselineskip
En un aspecto adicional, se proporciona un procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes:
(a)
proporcionar una o más alícuota(s) de la muestra, en la que cada alícuota comprende ácido nucleico en una cantidad que es inferior a un genoma por alícuota; (b) ampliar una o más secuencias de ácido nucleico en un marcador de prueba en cada alícuota(s) en una primera reacción de amplificación, en la que por lo menos una de las secuencias de ácido nucleico es un marcador de prueba y por lo menos una de las secuencias de ácido nucleico es un marcador de referencia; (c) dividir cada uno de los productos amplificados procedentes de la primera reacción de amplificación en por lo menos dos alícuotas de la réplica; (d) ampliar en una segunda reacción de amplificación el marcador de prueba procedente de una primera alícuota de la réplica y el marcador de referencia procedente de una segunda alícuota de la réplica preparadas en la etapa (c); y (e) calcular el número de copias del marcador de prueba comparando el número de productos amplificados para el marcador de prueba con las del marcador de referencia.
\vskip1.000000\baselineskip
Técnicas generales de metodología de ADN recombinante
La presente invención utiliza, a menos que se indique de otra manera, técnicas convencionales de biología molecular, microbiología y tecnología de ADN recombinante que están comprendidas en las capacidades de cualquier experto en la materia. Dichas técnicas se explican en la bibliografía. Véase, por ejemplo, J. Sambrook, E. F. Fritsch, y T. Maniatis, 1989, Molecular Cloning: A Laboratory Manual, Segunda Edición, Books 1-3, Cold Spring Harbor Laboratory Press; Ausubel, F. M. et al. (1995 y suplementos periódicos; Current Protocols in Molecular Biology, caps. 9, 13, y 16, John Wiley & Sons, Nueva York, N.Y.); B. Roe, J. Crabtree, y A. Kahn, 1996, DAN Isolation and Sequencing; Essential Techniques, John Wiley & Sons; M. J. Gait (Editor), 1984, Oligonucleotide Synthesis: A Practical Approach, Irl Press; y, D.M.J. Lilley y J.E. Dahlberg, 1992, Methods of Enzymology: DNA Structure Part A: Syntesis and Physical Analysis of DNA Methods in Enzymology, Academica Press. Cada uno de estos textos generales está incorporado en la presente memoria como referencia.
La invención se describirá a continuación con mayor detalle a título de ejemplo, lo que significa que sirven para ayudar a cualquier experto en la materia a llevar a cabo la invención y no se pretende en modo alguno limitar el alcance de la invención. Además, cada una de las varias formas de realización y aspectos de la presente invención tal como se definen en la presente memoria anteriormente y como se reivindican en el apartado reivindicaciones a continuación encuentran apoyo experimental en los Ejemplos siguientes.
\vskip1.000000\baselineskip
Ejemplos Ejemplo 1 Materiales y Procedimientos
Se cultivaron las estirpes celulares SK-RC-9 y SK-RC-12 ^{20} en DMEM más suero de ternero fetal al 10%. Se preparó ADN genómico procedente de las células SK-RC-9 y SK-RC-12 utilizando el kit DNeasy Tissue de Qiagen (Qiagen Ltd. U.K.). El ADN se diluyó con agua destilada hasta aproximadamente 10 genomas/\mul (aproximadamente 30 pg/\mul), y se almacenó a -70ºC en alícuotas.
A grandes rasgos, el análisis de muestras genómicas para secuencias múltiples en MCC se lleva a cabo utilizando una amplificación por RCP en dos fases, como se muestra en el diagrama de la Figura 1. Tres cebadores de RCP (directo e inverso, más un cebador directo interno anidado) se utilizan para cada locus (es decir el marcador genómico) que debe ensayarse. En la primera fase, los pares de cebadores múltiples de la RCP (directo e inverso), se combinan en una sola reacción múltiple. Los productos de esta reacción se utilizan como plantillas para las reacciones de RCP de la segunda fase, cada una de las cuales utiliza los cebadores directo-interno e inverso para una sola secuencia. La selección del cebador se llevó a cabo utilizando criterios sencillos (similares al diseño para utilizaciones convencionales de RCP) después de enmascarar elementos repetitivos de la secuencia genómica (Assembly NCBI 35, http://www.ensembl.org) utilizando Repeat-masker (http://www.repeatmasker.org). Por lo general, la longitud del cebador es de 18 a 20 p.b., con una Tm entre 52-60ºC (basada en el cálculo Tm=2x(A+T)+4x(G+C)). El diseño requiere por lo menos 2 bases G o C en el extremo 3' y por lo menos una en el extremo 5'. No se permiten series de ninguna base individual mayor de 4 bases. La longitud del amplímero interno se diseña para que esté comprendida entre 80 y 150 p.b. y la posición del cebador externo no superior a 150 p.b. corriente arriba del cebador directo interno.
La concentración de ADN es importante en el análisis de MCC pero no necesita ser demasiado exacta ya que se obtiene precisión con un contenido en ADN medio de \sim02-06 genomas haploides por alícuota. La concentración de partida de las preparaciones de ADN genómico se determinó utilizando espectrofotometría ultravioleta y basada en ésta, se realizó una serie de diluciones (convenientemente 6) que cabe esperar proporcionen entre 0,25 y 8 genomas de ADN por muestra. Dieciséis alícuotas de cada dilución se analizaron (utilizando MCC en placas de 96 pocillos, como se describió anteriormente) para cada uno de los cuatro marcadores, correspondiente a los segmentos de ADN que se cree que están presentes en una copia por genoma haploide. La producción de alícuotas (pocillos) que puntuaron positivas (promediados en los cuatro marcadores), se utilizó para calcular la concentración de ADN real en cada dilución. Estos datos se utilizaron a su vez para determinar el grado exacto de dilución requerida para análisis MCC. Cuando se ha determinado la concentración de trabajo para MCC, la dilución de ADN puede utilizarse para todas las etapas de MCC. Cada nueva preparación de ADN requiere valoración independiente.
Para MCC, se preparó una mezcla madre que contenía los cebadores de RCP directo e inverso para todas las secuencias que han de analizarse (0,15 \muM de cada oligo), 1 x tampón de RCP Gold (Perkin-Elmer), 2 mM MgCl_{2}, 200 \muM de cada dNTP y 0,1 u/\mul de Taq Gold ADN polimerasa (Perkin-Elmer) y aproximadamente 0,03 genomas/\mul (0,09 pg/\mul) de ADN genómico. 10 \mul de esta mezcla se dispensaron en cada uno de los 88 pocillos de una placa de 96 pocillos y los 8 pocillos restantes (referencias negativas) recibieron 10 \mul de una mezcla similar pero que carece de ADN. Todas las muestras se cubrieron con 20 \mul de aceite mineral. Los ciclos térmicos se realizaron en caliente partiendo a 93ºC durante 9 minutos, seguido de 25 ciclos de 20 segundos a 94ºC, 30 segundos a 52ºC, y 1 minuto a 72ºC. Cada reacción RCP se diluyó hasta 500 \mul con agua, y se utilizaron muestras de 5 \mul como plantilla en cada segunda fase (marcador específico) de RCP semianidada (MgCl_{2} 1,5 mM, 1 \muM de los cebadores directo interno y complementario adecuados, otras concentraciones como anteriormente y ciclo térmico a 93ºC durante 9 minutos, seguido de 33 ciclos de 20 segundos a 94ºC, 30 segundos a 52ºC y 1 minuto a 72ºC. Después de la RCP semianidada, se añadieron a cada pocillo 8 \mul de 2 x tampón de carga (15% p/v de Ficoll 400, 0,1 mg/ml de azul de bromofenol, 4x Sybr Green, 1x TBE) y se analizaron los productos de la amplificación por electroforesis durante 10 minutos a 10 V/cm en geles de poliacrilamida al 6% en placa horizontal de 108 pocillos prefundidos (geles MIRAGE; Genetix Ltd., U.K.) puntuando la presencia o ausencia del producto de la RCP en cada muestra. En experimentos posteriores, los resultados se puntuaron por el análisis de la curva de fusión utilizando un ABI 7900HT con el programa informático SDS del fabricante.
En estos casos, la mezcla de RCP para las RCP de segunda fase se modificó para que contenga MgCl_{2} 4 mM y 0,5 x SyBr GreenI (Cambrex, U.K.). Todas las reacciones de RCP de la segunda fase se realizaron con robot en placas múltiples de microvaloración de 384 pocillos (conteniendo cada placa las 96 reacciones de cada uno de los cuatro marcadores). (Nota: la segunda etapa de RCP semianidada no pudo realizarse en una segunda placa de 96 pocillos utilizando una pipeta multicanal para las transferencias, en lugar de un sistema robótico).
\vskip1.000000\baselineskip
Análisis estadístico de los datos de MCC
Si las moléculas de ADN se distribuyen al azar entre una serie de alícuotas entonces, a partir del número de alícuotas que puntúan positivo para cualquier secuencia dada, la concentración de esta secuencia (expresada en copias por alícuotas) puede determinarse a partir de la ecuación de Poisson (véase la información complementaria). Si se analizan dos o más secuencias de esta manera en la misma serie de alícuotas de ADN genómico, entonces pueden calcularse sus concentraciones relativas, y por consiguiente su abundancia relativa en el ADN genómico.
Por ejemplo, si dos marcadores de ADN (A y B) se puntúan en la misma serie de 88 alícuotas, y si los números de alícuotas que puntúan positivo para cada marcador fueran 34 y 56 respectivamente, entonces las concentraciones medias de las dos secuencias pueden calcularse (a partir de la ecuación ii, parte A de información complementaria en línea) como 0,49 y 1,0 copias por alícuota, respectivamente. Por consiguiente, si la secuencia A se sabe que está presente en n copias por genoma, puede deducirse que la secuencia B está presente en 2n copias por genoma.
\vskip1.000000\baselineskip
Hibridación in situ con fluorescencia (FISH)
El análisis por FISH se realizó siguiendo los protocolos habituales con fotografías del cromosoma completo (Vysis) o BAC ADN (clones BAC de Invitrogen Ltd.) convertido en fluorescente mediante la traducción DIG-nick y el kit fluorescente mejorador de anticuerpos para la detección por DIG (ROCHE Diagnostics Ltd., U.K.) según las instrucciones del fabricante. Los clones de BAC utilizados en este estudio de SK-RC-9 fueron RP11-24E1, RP11-781E19, RP11-413E6 en la rama corto del cromosoma 3 y CTD-2193G5, CTD-2197I11 en la rama larga del cromosoma 5. Los clones por BAC utilizados en este estudio de SK-RC-12 fueron RP11-328N12, RP11-24E1, RPH-413E6, RP11-528E14, RP11-424C9. Las posiciones del clon BAC son a partir del Ensembl Human Genome Server, Assembly NCBI 35.
\vskip1.000000\baselineskip
Análisis de hibridación en el filtro
El ADN genómico se digirió hasta terminación con encimas de restricción, se fraccionó en geles de agarosa al 0,8% y se transfirió a membranas HybondN (Amersham). La hibridación en filtro de Southern se realizó con los fragmentos aislados de vectores plásmidos^{24}, radiomarcados por reacciones de cebado de oligonucleótidos aleatorios tal como se describe ^{25}.
Las sondas genómicas para análisis de 5q y 3p en el ADN de SK-RC-9 se ampliaron en el ADN humano por RCP y los productos se clonaron utilizando el sistema de clonación TOPO (Invitrogen) y se verificaron las secuencias. Las secuencias de cebador para el cromosoma 3 sonda 3pA fueron AAGCAGGTTAAGGGAGAAGATGAC (posición genómica desde 74112725 hasta 74.114.748 p.b.) y CTCTGAACTCTCTTATTTAAAG (posición genómica desde 74113146 hasta 74113167 p.b.), para la sonda 3pB del cromosoma 3 fueron CCCATTGCTCCCCAGCC (posición genómica desde 74114114 hasta 74114137 p.b.) y GCTGTTGGAGGATGAGAGG (posición genómica desde 74114239 hasta 74114257 pb) y para la sonda del cromosoma 5q fueron CTGTTCATTCCTTCAACTTCCTA (posición genómica desde 105386013 hasta 105386035 pb) y GCTGATTTTATACATATATCTGTATG (posición genómica desde 105386412 hasta 105386437 pb).
La sonda del cromosoma 3 para la hibridación en el filtro del ADN de SK-RC-12 se realizó clonando el producto genómico de la PCR utilizando los cebadores GAATTCAGCTATTCAACGC (posición genómica en 81938151) y GGAAGTGCTAAACACAATGG (posición genómica en 81938388).
\vskip1.000000\baselineskip
Clonación por RCP inversa
La clonación por RCP inversa se realizó tal como se describe ^{21}. Se digirió ADN de SK-RC-9 (5 \mug) con 100 unidades de XbaI (New England Biolabs) durante la noche a 37ºC. El ADN digerido se extrajo con fenol y se recuperó con precipitación en etanol. El ADN digerido se puso en círculo por ligadura con 3.200 unidades de T4 ADN ligasa (New England Biolabs) en un volumen de 600 \mul a 16ºC durante 16 horas. El ADN ligado se precipitó con etanol y se disolvió en 40 \mul de Tris-HCI pH 7,4 a 25ºC, EDTA 1 mM. Se utilizaron cinco microlitros (\sim0.6 \mug de plantilla de ADN) en 50 \mul. La reacción RCP que contenía 500 \muM de cada dNTP, cebadores directo e inverso 1 \muM, 1x tampón (Expand Long Template Buffer 2, Roche) y 3,75 u de enzima Expand Long Template (Roche). Las condiciones de la amplificación por PCR fueron 94ºC durante 2 min, seguidos de 35 ciclos de 94ºC durante 15 s., 60ºC durante 30 s., 68ºC durante 15 min y una etapa de amplificación final a 68ºC durante 30 min. El producto de la RCP se separó en un gel de agarosa al 1%, se purificó utilizando Gel Extraction Kit de Qiagen (Qiagen) y se clonó en el vector de clonación TOPO (Invitrogen). Las secuencias de cebador para la RCP inversa de la unión de la transposición fueron CTTCCATACCACTTATGGTGTCTA complementaria (posición genómica en el cromosoma 3p a 74.112.296 hasta 74.112.319 p.b.) y AATGCAGACCCTCAAACTATACC transcrita (posición genómica en el cromosoma 3p a 74.112.472 hasta 74.112.494 pb).
Las secuencias del cebador para la amplificación por CPR de la zona de fusión de deleción del cromosoma 3 en SK-RC-12 fueron 5'-AATGTCATGCAGCATATGAC (posición genómica a 81.648.380) y TGATCTTGATTACA
TAGCATT (posición genómica a 81.937.983).
\vskip1.000000\baselineskip
Ejemplo 2 Recuento molecular del número de copias (MCC)
Las células normales son diploides para genes autosómicos en tanto que las células cancerosas pueden presentar transposiciones, deleciones, amplificación o inversiones cromosómicas. Si estos cambios conllevan alteraciones del número de copias en el estado diploide, es posible determinar éstas mediante recuento de la frecuencia de reiteración del ADN. El método MCC consigue esto por análisis de la frecuencia con la que se produce la amplificación por RCP del marcador genómico al limitar la dilución del ADN (realmente moléculas individuales de ADN). Las reacciones por RCP múltiples se realizan en un formato de 96 pocillos y relativo al número de copias determinado para marcadores adyacentes que depende del número de pocillos con un producto de RCP.
La esencia del método MCC se describe en la Figura 1, con un ejemplar de transposición desequilibrada. Los carcinomas renales frecuentemente llevan transposiciones no recíprocas entre los cromosomas 3 y 5 (p;q) ^{4,5,17,18} produciendo un desequilibrio del número de copias. Esto se ilustra en la Figura 1C en la que la transposición da como resultado un número de copias para la porción distal del cromosoma negro y 2n proximal para la transposición. El ADN genómico está muy diluido tal como se describe para la cartografía HAPPY^{19} y las alícuotas que contienen menos de un genoma haploide de ADN se distribuye en 88 pocillos de una placa de microvaloración de 96 pocillos, dejando 8 pocillos para las referencias negativas de la RCP. La primera ronda de análisis de RCP es una etapa de amplificación múltiple para cada una de las alícuotas con todos los cebadores externos mezclados en cada pocillo de la placa de 96 pocillos (Fig. 1D), de modo que todas las copias de cualquier secuencia diana se amplían en alguna medida. La segunda ronda de RCP es una etapa de RCP semianidada para cada marcador individual (es decir, no múltiple), utilizando como plantilla el producto de la RCP transferido desde la placa múltiple en placas de réplicas recientes (Fig. 1E, F). Estos productos de la RCP de la segunda ronda se separan en geles de poliacrilamida (Fig. 1 G, H) y se puntúan. La proporción de alícuotas que son positivas para cualquier marcador específico refleja el número de copias relativo de cada marcador en el genoma. En los experimentos expuestos en la presente memoria, el número de reacciones positivas a la RCP se recontaron manualmente. Se realizaron varias etapas por conveniencia empleando un sistema de transferencia robótico para desplazar las muestras entre las placas de microvaloración para la RCP y la RCP semianidada y en la segunda placa de microvaloración para el gel. Esto se puede llevar a cabo fácilmente en manual utilizando pipetas multicanal si la robótica no está disponible.
En la Figura 1G y H se presentan ejemplos de observación en gel de los productos de la RCP en MCC aplicados al carcinoma real, para marcadores distales o proximales al punto de inflexión no recíproco respectivamente. En lo anterior, 24 pocillos presentan un producto de RCP mientras que en el último 46 pocillos presentan un producto, lo que indica aproximadamente 2 veces el doble de la diferencia del número de copias entre los marcadores. (Los detalles del análisis estadístico pueden encontrarse en la información complementaria). Cuando se lleva a cabo una exploración inicial de una zona cromosómica, pueden utilizarse marcadores muy espaciados y la distancia entre ellos pueden variarse según la necesidad. Por ejemplo, si no existen datos citogenéticos disponibles (tal como puede ser el caso con el ADN obtenido de pequeñas muestras de biopsia), puede presentar ventajas explorar un cromosoma completo antes de centrarse en un área para un estudio más detallado. Aproximadamente 70 marcadores en aproximadamente un espacio de 2 Mb proporcionarían esta información para el total del cromosoma 3.
\vskip1.000000\baselineskip
Ejemplo 3 Identificación y clonación de una transposición no recíproca en cáncer renal
Una motivación tras el desarrollo del método MCC fue situar con precisión los puntos de inflexión de la transposición cromosómica no recíproca recurrente t(3;5)(p;q) en el carcinoma renal como preludio a su clonación. Estas importantes transposiciones cromosómicas han sido extensamente estudiadas por citogenetistas y se han descrito tres zonas de punto de inflexión principales en la rama corta del cromosoma 3 ^{6}. Se han creado estirpes celulares de carcinoma renal no papilar y papilar a partir de material de tumor primario y metastásico ^{20}. El análisis por FISH de la estirpe de células SK-RC-9 del carcinoma renal metastásico, utilizando las fotografías de los cromosomas 3 y 5, puso de manifiesto la presencia de unas transposición cromosómica t(3;5) no recíproca (Figura 1 complementaria en línea). La posición del punto de inflexión de la transposición cromosómica t(3;5) fue investigada inicialmente por FISH utilizando clones BAC de una zona de aproximadamente 3 Mb (73,2 a 75,8 Mb) del cromosoma 3p (Fig. 2). Ya que no hay ningún cromosoma derivado recíproco en el carcinoma renal t(3;5), no es posible obtener la cartografía fina de ningún clon de BAC que comprenda el punto de inflexión, ya que BACS se hibrida o no con el cromosoma der(3;5). Por lo tanto el análisis por BAC-FISH de las transposiciones recíprocas de este modo se basa en localizar BACS que flanquean el punto de inflexión (Fig. 2).
El clon BAC más próximo situado telomérico respecto del punto de inflexión de t(3;5) fue RP11-24E1 (en 73.256.358-73.419.679 p.b. del telómero 3p) porque este BAC se une a los cromosomas 3 normales pero no a la t(3;5) (Fig. 2A). EL clon RP11-781E19 por BAC (en 74.210.885-74.236.089 p.b. del telómero 3p) está situado precisamente proximal al punto de inflexión ya que se hibrida en ambos cromosomas 3 normal y t(3;5) (Fig. 2B). Estos datos situaban el punto de inflexión en la SK-RC-9 en una zona de cómo máximo 1 Mb del cromosoma 3p13-p12.3 (Fig. 2C et al.).
Los autores trataron de definir la posición del punto de inflexión de la transposición en el cromosoma 3 utilizando rondas múltiples de RCC a mayor resolución cada vez. Los datos de FISH (Fig. 2) demostraron que las secuencias de la rama corta del cromosoma 3 que ponen telomérico al punto de inflexión cabía esperar que estuvieran presentes en dos copias por célula (debido al carácter poliploide de las células SK-RC-9), mientras que las proximales al punto de inflexión, o en la rama larga, cabía esperar que estuvieran presentes en cuatro copias (es decir comprendiendo dos cromosomas 3 normales y dos cromosomas der 3;5). Los autores llevaron a cabo una ronda inicial de MCC examinando el número de copias de doce marcadores espaciados a intervalos de 0,2-0,5 Mb sobre aproximadamente 3,8 Mb en la zona del cromosoma 3p13-p12.3. Los resultados (Fig. 3, ronda 1) pusieron de manifiesto un doble desplazamiento en el número de copias relativo entre los marcadores situados a 73.760.583 p.b. y 74.333.559 pb, definiendo el supuesto punto de ruptura de la transposición en un intervalo de aproximadamente 570 kb. Se realizó una ronda posterior de MCC utilizando 12 marcadores a intervalos de aproximadamente 50 kb (Fig. 3, ronda 2), refinando más la zona de punto de inflexión supuesta en aproximadamente 40 kb. Dos rondas de MCC más (Fig. 3, ronda 3 y 4) situaron más el desplazamiento en número de copias a aproximadamente 1-4 kb y a continuación a 300 p.b. respectivamente. Además, la cuarta ronda de MCC puso de manifiesto una deleción aparente en el lado centromérico de la supuesta transposición (expuesto a continuación).
Los autores confirmaron que los datos de MCC correspondían a alteraciones genómicas utilizando hibridaciones en filtro. Se preparó una sonda en la zona del cromosoma 3p (Fig. 4, sonda 3pA) correspondiente al desplazamiento del número de copias y se hibridó para los filtros que llevan ADN genómico digerido con restricción en las células SK-RC-9 y una estirpe de células SK-RC-12 renales diferentes cuyo punto de inflexión t(3;5) se sitúa proximal al de SK-RC-9 (AD, GC y THR, sin publicar). Se observaron bandas cambiadas de posición con dos digestos de encima de restricción diferentes de SK-RC-9 (Fig. 4A), demostrando que el método MCC había identificado una anomalía genuina en el cromosoma 3 en esta estirpe celular.
\vskip1.000000\baselineskip
Ejemplo 4 Clonación del punto de inflexión de la transposición t(3;5) no recíproca
La ronda 4 del análisis por MCC del ADN de SK-RC-9 presentaba un desplazamiento del número de copias que, dada su posición genómica, era candidata para la unión de la transposición no recíproca entre los cromosomas 3 y 5. Ya que la secuencia normal de esta zona del cromosoma 3p es conocida, los autores diseñaron un par de cebadores del cromosoma 3 para la clonación por RCP inversa del ADN correspondiente a la anomalía. Este procedimiento para la clonación del ADN desconocido asociado a un segmento de ADN conocido se basa en el diseño de cebadores de RCP que pueden extenderse en direcciones opuestas (ilustrado en la Fig. 5A) en una plantilla de ADN circular ^{21}. Por consiguiente, el ADN de SK-RC-9 se digirió con XbaI, se hicieron círculos intramoleculares y se llevó a cabo la RCP para producir una banda de \sim 1,5 kb. La secuencia de este producto de RCP demostró que comprendía la unión de la transposición t(3;5) cromosómica no recíproca (Fig. 5B) en la que una zona del cromosoma 5q (la posición se muestra en la Fig. 5D, coordenada 105.386.443 pb) se había fusionado con una zona del cromosoma 3p (Fig. 5D, coordenada 74.111.893 pb). El resto de adenina en la unión puede proceder de uno de los dos cromosomas. La reestructuración de este segmento del cromosoma 5 en el ADN de las células SK-RC-9 fue presentada formalmente utilizando estudios de hibridación en filtro (Fig. 3B, sonda 5q).
\vskip1.000000\baselineskip
Ejemplo 5 La MCC puede detectar cambios cromosómicos crípticos
Durante la definición del punto de inflexión de la transposición mediante el análisis MCC, los autores observaron una reducción del número de copias adicional en una zona que comprende aproximadamente 700 p.b. prácticamente centromérico del punto de inflexión (Fig. 3 ronda 4). Este descubrimiento se comprobó con dos experimentos de MCC independientes (Figura 2 complementaria) comparando el ADN de SK-RC-9 con el de otro carcinoma renal (SK-RC-12) con una t(3;5) situada en una zona diferente del grupo 3p.
Una posible explicación para esta anomalía en el ADN de SK-RC podría ser una pequeña deleción en el cromosoma t(3;5), prácticamente centromérica del punto de inflexión de la transposición. Los autores tratan de corroborar esto mediante la RCP genómica con los cebadores que flanquean esta zona. Aunque podrían ampliar un fragmento del tamaño esperado (907 p.b.) procedente del cromosoma 3 normal, no existían pruebas de un producto más pequeño que debería haber sido amplificado a través del segmento de ADN eliminado (datos no representados). De este modo, esta deleción corta debe ser acompañada por la inserción de secuencias de otra posición. El análisis de hibridación en el filtro en la Figura 4 confirma esta posibilidad. Cuando el ADN de SK-RC-9 se digiere con BgIII, los autores esperarían un fragmento cambiado de posición en el cromosoma der(3;5) de aproximadamente 4,3 kb cuando se hibrida con la sonda 5q en la transposición estaban asociados simplemente con una pequeña deleción. En su lugar los autores observaron un fragmento mayor de aproximadamente 5 kb (Fig. 4B). Además, los tamaños observados de los fragmentos NcoI y SacI que utilizan la sonda 3pB (Fig. 4C) son ambos significativamente mayores que el esperado para una única deleción (11,5 kb o 9,5 kb observados y 4,5 kb o 4 kb esperados respectivamente). Los datos de la hibridación de NcoI son especialmente significativos porque la sonda 3pB no detecta la unión de la transposición sino solamente la anomalía adicional. Estos datos sugieren una inserción junto con la deleción y que la inserción que acompaña la microdeleción 3p parece ser mayor de 7 kb.
\vskip1.000000\baselineskip
Ejemplo 6 Una deleción de 289 kb en el cromosoma 3 y una estirpe celular de cáncer de riñón detectada por MCC
Una ilustración adicional de la sensibilidad de MCC fue proporcionada por la caracterización de una deleción críptica en la estirpe de las células SK-RC-12 del carcinoma renal de células transparentes que lleva una transposición t(3p;5q) no recíproca (datos no mostrados). El análisis FISH con clones RP11-528E14 de BAC (cromosoma 3 en 76,7-76,9 Mb) y RP11-424C9 (cromosoma 3 en 87,7-88,0 Mb) delineó la zona del punto de inflexión de la t(3;5) para una zona grande de aproximadamente 10 Mb. El análisis por MCC se realizó utilizando un panel de marcadores que comprenden esta zona a intervalos de aproximadamente 0,5 Mb (Fig. 6A, ronda 1). Se observó un desplazamiento del número de copias entre los marcadores 22 y 23 (los geles analíticos para los productos de RCP de los marcadores 21, 22, 24 y 25 se muestran en la Fig. 3 complementaria). Las rondas sucesivas de MCC con más marcadores poco espaciados (Fig. 6A, rondas 2 y 3) resolvieron la región a aproximadamente 2 kb y una ronda final de MCC localizó el desplazamiento del número de copias en 400 p.b. (Fig. 6A, ronda 4). La presencia de una alteración genómica se confirmó por hibridación en el filtro utilizando una sonda de 237 p.b. del cromosoma 3 y comparando los fragmentos de restricción en el ADN de SK-RC-12 con los de una estirpe celular linfoblastoide (LCL). Se observó un fragmento cambiado de posición en cada caso con el ADN de SK-RC-12 (Fig. 4 complementaria).
Se obtuvo la zona genómica correspondiente al desplazamiento del número de copias de la ronda 4 utilizando la RCP inversa. Para obtener esta secuencia de la zona de unión, se digirió el ADN genómico con NcoI y se autoligó para formar las plantillas del ADN circular, se amplió utilizando la secuencia del cromosoma 3 situada con la ronda 4 de MCC. El producto de la RCP se clonó y se obtuvo la secuencia, poniendo de manifiesto que el cambio del número de copias procedente de una sola deleción del cromosoma 3p de \sim 289 kb (Fig. 6B, 81,64 y 81,94 Mb). Las secuencias de las zonas que flanquean el punto de deleción del cromosoma 3 normal se comparan con las del cromosoma 3 fusionado en SK-RC-12 (Fig. 6B). Esto da a conocer la identidad de una zona de 6 p.b. en ambos extremos del segmento de la deleción (Fig. 6B) sugiriendo que esta microhomología puede haber sido utilizada en la unión del extremo no homólogo para reparar las roturas de doble cadena.
\vskip1.000000\baselineskip
Ejemplo 7 Análisis estadístico de los resultados de MCC
Si se distribuyen al azar moléculas de ADN entre N alícuotas para proporcionar un promedio de Z moléculas por alícuota entonces, según la distribución de Poisson, el número de alícuotas Np que cabe esperar contengan por lo menos una molécula de ADN viene dado por:
(i)Np=N(1-e^{-z})
Por el contrario, si un panel de N alícuotas subgenómicas de ADN viene determinado por la RCP para una secuencia dada, y si Np de estas alícuotas puntúan positivo para la secuencia (es decir contienen por lo menos una copia de la secuencia) entonces el número medio de moléculas de esta secuencia por alícuotas puede calcularse de la manera siguiente:
(ii)Z=-ln(1-Np/N)
\newpage
\global\parskip0.900000\baselineskip
Por consiguiente, a partir del número de alícuotas que puntúan positivo para cualquier secuencia dada, puede determinarse la concentración de esta secuencia (expresada en copias por alícuotas). Si se analizan dos o más secuencias de esta manera en la misma serie (o series similares) de alícuotas de ADN genómico, entonces pueden calcularse sus concentraciones relativas y por consiguiente su abundancia relativa en el ADN genómico.
\vskip1.000000\baselineskip
Ejemplo 8 Clones BAC y cebadores por RCP utilizados para el análisis MCC Clones BAC
Clones BAC utilizados para definir la posición de la t(3;5) en células SK-RC-9 se situaron en los cromosomas 3 y 5 utilizando la base de datos Ensembl de genoma humano, montaje NCBI 35 en http://www.ensembl.org/
\vskip1.000000\baselineskip
Lista de clones BAC
Coordenadas de BAC en 3p (donde el resto 1 está situado en el telómero del cromosoma 3p):
RP11-24E1 73256358-73419679 bp
RP11-781E19 74210885-74236089 bp
RP11-413E6 75698634-75885406 bp
\vskip1.000000\baselineskip
Coordenadas de BAC en 5q (donde el resto 1 está situado en el centrómero del cromosoma 5)
CTD-2193G5 102719818-102903604 bp
CTD-197111 108078031-108252168 bp
\vskip1.000000\baselineskip
Cebadores utilizados en el análisis MCC de SK-RC-9
Los cebadores procedían del servidor Ensembl del genoma humano, construcción 35 y las coordenadas dadas se refieren a esta información de la secuencia. Como esto está bajo revisión en curso, la posición exacta de cualquier tiempo futuro debería determinarse utilizando una búsqueda BLAST de la base de datos del genoma.
Los cebadores utilizaron el análisis de SK-RC-9 se presentan en la Tabla 1.
\vskip1.000000\baselineskip
Lista de clones de BAC utilizados para el FISH de SK-RC-12
Coordenadas de BAC en 3p (donde el resto 1 está situado en el telómero del cromosoma 3p):
RP11-328N12 cromosoma 3 at 72.5-72.7 Mb
RP11-24E1 cromosoma 3 at 73.1-73.3 Mb
RP11-413E6 cromosoma 3 at 75.5-75.7 Mb
RP11-528E14 cromosoma 3 at 76.7-76.9 Mb
RP11-424C9 cromosoma 3 at 87.7-88.0 Mb
\vskip1.000000\baselineskip
Exposición La transposición t(3;5) de cáncer renal
En el contexto de la presente invención se ha demostrado que MCC puede hacer el recuento directamente de las copias de diferentes secuencias mientras se explora una zona cromosómica o genómica para identificar variaciones locales en el número de copias. Las iteraciones de este procedimiento permiten localizar rápidamente los límites exactos del segmento anómalo, como los autores han demostrado por localización y clonación del punto de inflexión de una transposición cromosómica no recíproca. El punto de inflexión específico que los autores han clonado representa el primer ejemplo de clonación de una transposición cromosómica no recíproca por primera vez. El cáncer renal tiene un pronóstico muy pobre^{22} y los tumores que aparecen en el túbulo proximal (cáncer renal no papilar) con frecuencia presentan una transposición t(3;5) cromosómica no recíproca. Los puntos de inflexión en el grupo 3 del cromosoma para tres zonas diferentes de la rama corta ^{6} y el uno que describen los autores en este artículo (en las células SK-RC-9) se localizan en el grupo más distante (en el cromosoma 3p13). El análisis de la secuencia de ADN del punto de inflexión de uno de los dos cromosomas 3p o 5q en SK-RC-9 demuestran que no existe ni pérdida ni ganancia de material específicamente en la unión, lo que implica la rotura y reparación precisas en el extremo. Además, las roturas no conllevan la escisión en ninguno de los genes conocidos o supuestos (véase la Fig. 5). De este modo, la transposición no proporcionaría un gen de fusión, y sugiere además un mecanismo diferente para los principales resultados oncogénicos de la transposición no recíproca. La utilización de MCC para analizar y clonar los puntos de inflexión de otras transposiciones no recíprocas del carcinoma renal no arrojan más luz sobre esto, y la comparación de las secuencias del punto de inflexión entre diferentes transposiciones debería ayudar a clarificar si existe algún mecanismo de transposición específico para la secuencia.
\vskip1.000000\baselineskip
Las alteraciones cromosómicas coexisten con las transposiciones no recíprocas en el cáncer renal
En este estudio, se han utilizado la nueva tecnología de MCC para determinar la posición de un punto de inflexión de la transposición no recíproca y la existencia de dos deleciones crípticas en el cromosoma 3. Esta eficacia de la técnica al utilizar rondas iterativas de determinación del número de copias con aumento de resolución ha sido aplicada para clonar y secuenciar dos de los cambios asociados al cáncer. Existen pruebas crecientes de que la deleción y amplificación acompaña a las transposiciones cromosómicas, salvo si son funcionalmente significativas o no ha sido difícil de determinar debido a la penuria de ensayos funcionales. Como los cromosomas implicados en transposiciones intercromosómicas son intrínsecamente inestables en el momento de la ruptura de la doble cadena, la incidencia de cambios adicionales puede no parecer demasiado sorprendente. Sin embargo, los mecanismos de reparación del ADN tienen intrínsecamente gran fidelidad, lo que añade creencia a la idea de que los cambios pueden ser funcionalmente importantes.
\vskip1.000000\baselineskip
El MCC se centra en el análisis del genoma
El MCC adolece de varios inconvenientes sobre otros procedimientos para localizar alteraciones en un número de copias. El procedimiento ofrece efectivamente resolución ilimitada ya que las secuencias pueden examinarse en amplios intervalos por debajo de unos pocos centenares de pares de bases. Ya que MCC utiliza la información de la secuencia del genoma, solamente requiere una base de datos de genoma para su operación y una serie de cebadores de RCP. Los bancos de cebadores de RCP, formateados para su utilización en MCC, pueden ser creados para permitir la rápida identificación de zonas cromosómicas o de genomas completos. Además, el método debería ser aplicable a zonas de amplificaciones genómicas, así como a deleciones.
A diferencia de las tecnologías basadas en la matriz para la determinación del número de copias, MCC no requiere la amplificación del genoma completo o de ninguna etapa de hibridación. Esto evita algunos problemas que pueden surgir de la amplificación sesgada, la supresión incompleta de secuencias repetidas en la sonda o la hibridación cruzada, como puede ocurrir cuando se utilizan matrices oligo cortas o por amplificación del ADN de E. coli que contamina los BAC/PAC para la matriz CGH ^{9}. La cuantificación exacta del número de copias por MCC depende de la amplificación con éxito de todas las copias de un locus en el panel de alícuotas. La mayoría de los conjuntos de cebadores de RCP opera bien (detectando la mayoría de las copias) o no en absoluto (no detectando copias, o proporcionando productos de RCP muy escasos en todos los casos). Estas últimas son obvias y pueden descartarse del análisis, ya que fueron realizadas para los marcadores 5 y 7 (Fig. 3, ronda 1). No obstante, un solo marcador de aparentemente poco número de copias puede ser observado con cuidado, ya que podría surgir solamente de un fallo para detectar alguna de las copias de este locus. En la práctica, esto no es un inconveniente, ya que la aparente pérdida de copias será confirmada (o no) a medida que proceda el análisis a mayor resolución. El MCC es esencialmente un método digital que simplifica la interpretación de resultados mientras que los métodos de micromatriz son cuantitativos a menudo requieren algoritmos complejos para la interpretación ^{23}. Aunque el MCC es fácilmente aplicable a la operación manual, se presta también bien a la automatización, y debería ser adaptable a otras plataformas para el análisis de RCP de alto rendimiento con ahorros potenciales de tiempo y costes.
El MCC requiere cantidades minúsculas de ADN genómico, siendo aplicable desde pocas decenas a centenares de células, y el ADN no tiene que ser de alto peso molecular. Los autores sugieren por lo tanto que el MCC haya sido capaz hasta la fecha de estudios poco prácticos, tales como el análisis detallado del material de biopsia preneoplásico de los pacientes, el análisis retrospectivo de muestras de tumor de archivo, o la exploración de la variabilidad genómica a través de diferentes pequeñas zonas de un tumor. El MCC debería también simplificar el análisis de anomalías cromosómicas hereditarias que afectan al número de copias, si están asociadas con la enfermedad o forman parte de un espectro normal de variación humana. La utilización de MCC en el trabajo actual de los autores emplea estirpes celulares en las que los desequilibrios son constantes de célula a célula. La aplicación de MCC a las diferencias constitucionales del número de copias (por ejemplo en síndromes heredados), será similar ya que todo el ADN será idéntico. Éste no será necesariamente el caso de las biopsias de material basado en la enfermedad, donde la "igualdad" del muestreo podría influir en la utilidad (como en otros procedimientos basados en el número de copias). Las muestras de tumor pueden ser un resultado específico ya que las resecciones comprenderán células cancerosas, células de estroma (probablemente de cariotipo normal) y células inflamatorias. No obstante, las pequeñas cantidades de material requerido para MCC y la sensibilidad del método posibilitarían detectar anomalías del número de copias incluso frente a algún antecedente de ADN normal.
4
5
6
Referencias
1. Albertson, D.G., Collins, C., McCormick, F. & Gray, J.W. Chromosome aberrations in solid tumors. Nat Genet 34, 369-376 (2003).
2. Rabbitts, T.H. Chromosomal translocations in human cancer. Nature 372, 143-149 (1994).
3. Huntly, B.J., Bench, A. & Green, A.R. Double jeopardy from a single translocation: deletions of the derivative chromosome 9 in chronic myeloid leukemia. Blood 102, 1160-1168 (2003).
4. Kovacs, G., Szucs, S., De Riese, W. & Baumgartel, H. Specific chromosome aberration in human renal cell carcinoma. Int. J. Cancer 40, 171-178 (1987).
5. Kovacs, G. & Brusa, P. Recurrent genomic rearrangements are not at the fragile sites on chromosomes 3 and 5 in human renal cell carcinomas. Hum Genet 80, 99-101 (1988).
6. Kovacs, G. et al. The Heidelberg classification of renal cell tumours. J. Pathol. 183, 131-133 (1997).
7. Pinkel, D. & Albertson, D.G. Comparative genomic hybridization. Annu Rev Genomics Hum Genet 6, 331-354 (2005).
8. Fiegler, H. et al. DNA microarrays for comparative genomic hybridization based on DOP-PCR amplification of BAC and PAC clones. Genes Chromosomes Cancer 36, 361-374 (2003).
9. Menten, B. et al. arrayCGHbase: an analysis platform for comparative genomic hybridization microarrays. BMC Bioinformatics 6, 124 (2005).
10. Brennan, C. et al. High-resolution global profiling of genomic alterations with long oligonucleotide microarray. Cancer Res 64, 4744-4748 (2004).
11. Carvalho, B., Ouwerkerk, E., Meijer, G.A. & Ylstra, B. High resolution microarray comparative genomic hybridisation analysis using spotted oligonucleotides. J Clin Pathol 57, 644-646 (2004).
12. Lucito, R. et al. Representational oligonucleotide microarray analysis: a high-resolution method to detect genome copy number variation. Genome Res 13, 2291-305 (2003).
13. Sebat, J. et al. Large-scale copy number polymorphism in the human genome. Science 305, 525-528 (2004).
14. Jobanputra, V. et al. Application of ROMA (representational oligonucleotide microarray analysis) to patients with cytogenetic rearrangements. Genet Med 7, 111-118 (2005).
15. Zhou, W. et al. Counting alleles reveals a connection between chromosome 18q loss and vascular invasion. Nat Biotechnol 19, 78-81 (2001).
16. Zhao, X. et al. Homozygous deletions and chromosome amplifications in human lung carcinomas revealed by single nucleotide polymorphism array analysis. Cancer Res 65, 5561-5570 (2005).
17. Heim, S. & Mitelman, F. Cytogenetics of solid tumours. Recent Advances in Histopathology, 37-66 (1991).
18. Hoglund, M. et al. Dissecting karyotypic patterns in renal cell carcinoma: an analysis of the accumulated cytogenetic data. Cancer Genet Cytogenet 153, 1-9 (2004).
19. Dear, P.H. & Cook, P.R. Happy mapping: a proposal for linkage mapping the human genome. Nucleic Acids Res 17, 6795-6807 (1989).
20. Ebert, T., Bander, N.H., Finstad, C.L., Ramsawak, R.D. & Old, L.J. Establishment and characterisation of human renal cancer and normal kidney cell lines. Cancer Res. 50, 5531-5536 (1990).
21. Suzuki, T. et al. New genes involved in cancer identified by retroviral tagging. Nat Genet 32, 166-174 (2002).
22. Cohen, H.T. & McGovern, F.J. Renal-cell carcinoma. N Engl J Med 353, 2477-2490 (2005).
23. Daruwala, R.S. et al. A versatile statistical analysis algorithm to detect genome copy number variation. Proc Natl Acad Sci USA 101, 16292-16297 (2004).
24. LeFranc, M.-P., Forster, A., Baer, R., Stinson, M.A. & Rabbitts, T.H. Diversity and rearrangement of the human T cell rearranging \gamma genes: Nine germ-line variable genes belonging to two subgroups. Cell 45, 237-246 (1986).
25. Feinberg, A.P. & Vogelstein, B.A. A technique for radiolabelling DNA restriction endonuclease fragments to high specific activity. Anal. Biochem. 132, 6-13 (1983).
Varias modificaciones y variaciones de los procedimientos y del sistema descritos de la invención serán evidentes para los expertos en la materia. Aunque la invención ha sido descrita en relación con formas de realización preferidas específicas, debe sobreentenderse que la invención tal como se reivindica no debería estar limitada indudablemente a dichas formas de realización específicas. De hecho, varias modificaciones de los modos descritos de llevar a cabo la invención serán obvios para los expertos en biología molecular o los campos relacionados se pretenden que estén comprendidos dentro del alcance de las reivindicaciones siguientes.

Claims (19)

1. Procedimiento de medición de la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra, que comprende las etapas siguientes:
(a)
proporcionar una diversidad de alícuota(s) de la muestra, en la que cada alícuota comprende ácido nucleico en una cantidad que es inferior a un genoma por alícuota;
(b)
ampliar una o más secuencias de ácido nucleico en cada alícuota(s) en una primera reacción de amplificación;
(c)
subdividir uno o más de los productos empleados en alícuotas de la réplica y llevar a cabo una segunda reacción de amplificación para una o más secuencias de ácido nucleico en cada alícuota(s), en la que cada una de las secuencias de ácido nucleico es un marcador de prueba y por lo menos una de las secuencias de ácido nucleico es un marcador de referencia;
(d)
calcular el número de copias por comparación en cada una de las alícuotas de la réplica del número de productos amplificados obtenido en el marcador de prueba con el número de productos amplificados obtenidos para el marcador de referencia.
\vskip1.000000\baselineskip
2. Procedimiento según la reivindicación 1, en el que cada alícuota en la primera reacción de amplificación comprende aproximadamente 0,1 a 0,9 genomas de ADN por reacción de amplificación.
3. Procedimiento según la reivindicación 1 ó 2, en el que el número de copias del marcador de prueba se calcula contando manualmente el número de productos de amplificación para el marcador de prueba y el marcador de referencia.
4. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que el número de copias del marcador de prueba se calcula utilizando la ecuación:
Np=N(1-e^{-z})
en la que N es el número de alícuotas; Z es el número promedio de productos amplificados por alícuota; y Np es el número de alícuotas que cabe esperar que contenga por lo menos una molécula del ácido nucleico según la distribución de Poisson.
\vskip1.000000\baselineskip
5. Procedimiento según cualquiera de las reivindicaciones 1 a 3, en el que el número de copias del marcador de prueba se calcula utilizando la ecuación:
Z=-ln(1-Np/N)
en la que N es el número de alícuotas del ácido nucleico sometido a prueba para una secuencia dada; Np es el número de alícuotas que puntúan positivo para el ácido nucleico (es decir, por lo menos una copia de la secuencia del ácido nucleico está amplificada).
\vskip1.000000\baselineskip
6. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que las reacciones de amplificación se realizan utilizando PCR.
7. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que la primera reacción de amplificación se lleva a cabo utilizando pares cebadores directos e inversos.
8. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que la segunda reacción de amplificación se lleva a cabo utilizando pares cebadores directos-internos e inversos.
9. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que la concentración de ácido nucleico en la muestra antes de la división en alícuotas se determina por amplificación de uno o más ácidos nucleicos que se cree que están presentes en sólo una copia por genoma haploide en dos o más divisiones diferentes, en la que la proporción de muestras en cada dilución hallada positiva para uno o más ácidos nucleicos se utiliza para refinar la estimación de la concentración de ADN y determinar así la dilución requerida para el análisis posterior.
\newpage
10. Procedimiento de identificación de una o más alteraciones en una muestra de ácido nucleico, que comprende las etapas siguientes:
(a)
medir la frecuencia del número de copias de una o más secuencias de ácido nucleico en una primera muestra y una segunda muestra según el procedimiento según cualquiera de las reivindicaciones 1 a 9;
(b)
opcionalmente repetir iterativamente el procedimiento a resoluciones progresivamente superiores para cada una de las muestras; y
(c)
identificar una o más diferencias en la frecuencia del número de copias de una o más secuencias de ácido nucleico en la primera y la segunda muestras.
\vskip1.000000\baselineskip
11. Procedimiento según la reivindicación 10, en el que las muestras son o proceden de sujetos enfermos y sanos.
12. Procedimiento según la reivindicación 11, en el que la enfermedad es el cáncer.
13. Procedimiento según cualquiera de las reivindicaciones 10 a 12, en el que el procedimiento se realiza inicialmente a una resolución de 2 Mb disminuyendo progresivamente hasta 100 pares de bases o menos.
14. Procedimiento según cualquiera de las reivindicaciones 10 a 13, en el que la alteración es una transposición, una amplificación, una duplicación o una deleción.
15. Procedimiento para diagnosticar una enfermedad en un paciente, que comprende las etapas siguientes:
(a)
medir la frecuencia del número de copias de una o más secuencias de ácido nucleico en una muestra según el procedimiento según cualquiera de las reivindicaciones 1 a 9; y
(b)
comparar el número de copias de dichas una o más secuencias de ácido nucleico con el número de copias normales de dichas una o más secuencias de ácido nucleico;
en el que una diferencia entre los números de copias de dichas una o más secuencias de ácido nucleico en la muestra y el número de copias normales de dichas una o más secuencias de ácido nucleico es indicativo de que el paciente está padeciendo la enfermedad.
\vskip1.000000\baselineskip
16. Procedimiento según la reivindicación 15, en el que si el número de copias de una o más secuencias de ácido nucleico en la muestra de ácido nucleico del paciente es superior al número de copias normales es indicativo de una transposición, una amplificación o una duplicación.
17. Procedimiento según la reivindicación 15, en el que si el número de copias de una o más secuencias de ácido nucleico en la muestra de ácido nucleico del paciente es inferior al número de copias normales es indicativo de una deleción.
18. Procedimiento para clonar una o más alteraciones en una muestra de ácido nucleico que comprende las etapas siguientes:
(a)
identificar una o más alteraciones en una muestra de ácido nucleico según cualquiera de las reivindicaciones 10 a 14; y
(b)
clonar dichas una o más alteraciones.
\vskip1.000000\baselineskip
19. Procedimiento según la reivindicación 18, en el que la alteración se clona utilizando clonación por RCP inversa.
ES07732383T 2006-04-12 2007-04-12 Procedimiento para determinar el numero de copias. Active ES2337207T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US79175406P 2006-04-12 2006-04-12
US791754P 2006-04-12

Publications (1)

Publication Number Publication Date
ES2337207T3 true ES2337207T3 (es) 2010-04-21

Family

ID=38510432

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07732383T Active ES2337207T3 (es) 2006-04-12 2007-04-12 Procedimiento para determinar el numero de copias.

Country Status (8)

Country Link
US (1) US20090191556A1 (es)
EP (1) EP2002016B1 (es)
JP (1) JP5491171B2 (es)
AT (1) ATE449193T1 (es)
DE (1) DE602007003331D1 (es)
DK (1) DK2002016T3 (es)
ES (1) ES2337207T3 (es)
WO (1) WO2007129000A2 (es)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702468B2 (en) 2006-05-03 2010-04-20 Population Diagnostics, Inc. Evaluating genetic disorders
US10522240B2 (en) 2006-05-03 2019-12-31 Population Bio, Inc. Evaluating genetic disorders
WO2010088288A2 (en) * 2009-01-28 2010-08-05 Fluidigm Corporation Determination of copy number differences by amplification
GB201007522D0 (en) 2010-05-05 2010-06-23 Mrc Technology Method
US20110275068A1 (en) * 2010-05-10 2011-11-10 Medical Research Council Method
EP2601609B1 (en) * 2010-08-02 2017-05-17 Population Bio, Inc. Compositions and methods for discovery of causative mutations in genetic disorders
US10221454B2 (en) 2011-10-10 2019-03-05 The Hospital For Sick Children Methods and compositions for screening and treating developmental disorders
US11180807B2 (en) 2011-11-04 2021-11-23 Population Bio, Inc. Methods for detecting a genetic variation in attractin-like 1 (ATRNL1) gene in subject with Parkinson's disease
RU2593708C2 (ru) * 2012-01-20 2016-08-10 БГИ Диагносис Ко., Лтд. Способ и система выявления вариации числа копий в геноме
DK2812452T3 (da) 2012-02-09 2020-06-29 Population Bio Inc Fremgangsmåder og sammensætninger til screening og behandling af udviklingsforstyrrelser
EP2895621B1 (en) 2012-09-14 2020-10-21 Population Bio, Inc. Methods and compositions for diagnosing, prognosing, and treating neurological conditions
US10233495B2 (en) 2012-09-27 2019-03-19 The Hospital For Sick Children Methods and compositions for screening and treating developmental disorders
GB2558326B (en) 2014-09-05 2021-01-20 Population Bio Inc Methods and compositions for inhibiting and treating neurological conditions
JP6284137B2 (ja) * 2015-11-18 2018-02-28 国立研究開発法人海洋研究開発機構 標的核酸の定量方法及びそのためのキット
US20190189241A1 (en) 2016-07-20 2019-06-20 Biontech Rna Pharmaceuticals Gmbh Selecting Neoepitopes as Disease-Specific Targets for Therapy with Enhanced Efficacy
US10240205B2 (en) 2017-02-03 2019-03-26 Population Bio, Inc. Methods for assessing risk of developing a viral disease using a genetic test
HRP20221504T1 (hr) 2018-08-08 2023-03-31 Pml Screening, Llc Postupci procjene rizika od razvoja progresivne multifokalne leukoencefalopatije uzrokovane john cunningham virusom pomoću genetskog testiranja

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5888740A (en) * 1997-09-19 1999-03-30 Genaco Biomedical Products, Inc. Detection of aneuploidy and gene deletion by PCR-based gene- dose co-amplification of chromosome specific sequences with synthetic sequences with synthetic internal controls
NL1021160C2 (nl) * 2002-07-26 2004-01-27 Multigen Internat B V Werkwijze voor het bepalen van het kopieaantal van een nucleotidevolgorde.
JP4773338B2 (ja) * 2003-03-07 2011-09-14 ルビコン ゲノミクス, インコーポレイテッド Dna重合プロセスにより生成される全ゲノムおよび全トランスクリプトームライブラリーの増幅および分析
DE102004036285A1 (de) * 2004-07-27 2006-02-16 Advalytix Ag Verfahren zum Bestimmen der Häufigkeit von Sequenzen einer Probe
GB0426188D0 (en) * 2004-11-30 2004-12-29 Leuven K U Res & Dev DNA repeats
DE102005045560B4 (de) * 2005-09-23 2009-02-12 Advalytix Ag Verfahren zur quantitativen Bestimmung der Kopienzahl einer vorbestimmten Sequenz in einer Zelle
DE102005059227A1 (de) * 2005-12-12 2007-06-14 Advalytix Ag Verfahren zur Bestimmung des Genotyps aus einer biologischen Probe enthaltend Nukleinsäuren unterschiedlicher Individuen
ES2739483T3 (es) * 2006-02-02 2020-01-31 Univ Leland Stanford Junior Detección genética fetal no invasiva mediante análisis digital

Also Published As

Publication number Publication date
WO2007129000A2 (en) 2007-11-15
EP2002016B1 (en) 2009-11-18
JP2009533040A (ja) 2009-09-17
EP2002016A2 (en) 2008-12-17
US20090191556A1 (en) 2009-07-30
ATE449193T1 (de) 2009-12-15
DK2002016T3 (da) 2010-03-29
WO2007129000A3 (en) 2008-03-13
DE602007003331D1 (de) 2009-12-31
JP5491171B2 (ja) 2014-05-14

Similar Documents

Publication Publication Date Title
ES2337207T3 (es) Procedimiento para determinar el numero de copias.
Durmaz et al. Evolution of genetic techniques: past, present, and beyond
ES2688458T3 (es) Recuento varietal de ácidos nucleicos para obtener información del número de copias genómicas
ES2886923T3 (es) Métodos y composición para generar sondas de ADN de secuencia única, marcaje de sondas de ADN y el uso de estas sondas
US7303880B2 (en) Microdissection-based methods for determining genomic features of single chromosomes
CN108138231A (zh) 分型和组装不连续基因组元件
US11857940B2 (en) High-level multiplex amplification
CN107849606A (zh) 提高下一代测序灵敏度的方法
CN108463559A (zh) 肿瘤的深度测序概况分析
Marotta et al. A common copy-number breakpoint of ERBB2 amplification in breast cancer colocalizes with a complex block of segmental duplications
CN110628891A (zh) 一种对胚胎进行基因异常筛查的方法
KR20190020133A (ko) 염색체에 대한 인-시츄 혼성화를 위한 dna 탐침
CA2324866A1 (en) Biallelic markers for use in constructing a high density disequilibrium map of the human genome
KR20110106244A (ko) 간세포암종의 예후 진단용 단일 염기 다형성
EP1829979B1 (en) Method of identifying gene with variable expression
CN107614704A (zh) 采样测序
AU2010253978B2 (en) Methods of scoring gene copy number in a biological sample using in situ hybridization
JP5288387B1 (ja) テロメア配列増幅用プライマー
US20090181397A1 (en) Predictive and diagnostic methods for cancer
CN115715321A (zh) 用于鉴定基因组dna中与蛋白质结合的区域的方法、组合物和试剂盒
US20040234961A1 (en) Telomere length determination and applications
US9139881B2 (en) Method for assessing breast cancer susceptibility
JP2006304611A (ja) Pcr法、プライマー及びpna。
Kowalska et al. A new platform linking chromosomal and sequence information
RU2818323C2 (ru) Способ получения полноразмерной последовательности митохондриальной ДНК человека с использованием набора олигонуклеотидов методом мультиплексной амплификации для работы с образцами деградированной ДНК