ES2544265T3

ES2544265T3 - Combinaciones de polimorfismos para determinar la expresión específica de alelo de IGF2

Info

Publication number: ES2544265T3
Application number: ES10741738.8T
Authority: ES
Inventors: Jared Ordway; Rebecca Maloney; Nathan Lakey; Muhammad A. Budiman
Original assignee: Orion Genomics LLC
Current assignee: Orion Genomics LLC
Priority date: 2009-02-11
Filing date: 2010-02-11
Publication date: 2015-08-28
Anticipated expiration: 2030-02-11
Also published as: JP2015180207A; JP5748672B2; EP2396429A2; EP2396429B1; AU2010213727A1; CA2751758A1; WO2010093820A2; WO2010093820A3; US20100286926A1; JP2012517242A; EP2396429A4; EP2955234A1

Abstract

Método para determinar pérdida de impronta en el gen del Factor de Crecimiento Insulínico de tipo 2 (IGF2) de un individuo, donde el método comprende detectar el genotipo del SNP del gen IGF2 en el individuo, en donde (a) se determina el genotipo de al menos las SEQ ID Nos: 8, 11, 14, y 16, y opcionalmente también los SNP seleccionados del grupo que consiste en las SEQ ID Nos: 1, 5, 9, 10, 2, 3, 4, 6, 7, 12, 13 y 15, o (b) se determina el genotipo de al menos las SEQ ID Nos: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15 y 16, determinando de ese modo si el individuo es heterocigoto o homocigoto en cada uno de los SNP; cuantificando en una muestra del individuo la cantidad de ARN que comprende dos opciones polimórficas de al menos un SNP heterocigoto; determinando una relación de la cantidad de ARN que comprende dos opciones polimórficas de al menos un SNP heterocigoto; y correlacionando la relación de ARN con la pérdida de impronta del gen IGF2.

Description

Combinaciones de polimorfismos para determinar la expresión específica de alelo de IGF2

Antecedentes de la invención

El gen paraelfactorde crecimientosimilara la insulina de tipo 2,o IGF2, se localiza en un grupo de genes impresos en el cromosoma humano 11p15.5. La impronta genómica es un importante mecanismo de regulación génica en el que una copia del gen se expresa normalmente y la otra copia se silencia mediante una marca epigenética de origen parental. Normalmente, el IGF2 está impreso en los tejidos humanos maternalmente y, por lo tanto, únicamente se expresa a partir de la copia del gen heredado por vía paterna (DeChiara TM, et al. Cell 64, 849-859 (1991); Rainier S, et al, Nature 362, 747-749 (1993); Ogawa, et al, Nature 362, 749-751 (1993)). La pérdida de impronta del IGF2 (denominada pérdida de impronta, o LOI por sus siglas en inglés) ha sido claramente asociada a varios tipos de cáncer (alrededor de 20 tipos de tumores revisados en Falls, et al. 1999, AJP 154, 635-647). Además, la creciente evidencia indica que los individuos que presentan LOI del IGF2 pueden tener un riesgo elevado de desarrollar cáncer colorrectal (Kinochi et al., 1996, Cancer Letters 107, 105-108 (1996); Nishihara S. 2000, Int. Jour. Oncol. 17, 317-322; Cui H 1998, Nature Medicine 4-11, 1276-1280; Nakagawa H 2001, PNAS 98-2, 591-596). La LOI del IGF2 puede detectarse en tejidos normales de pacientes con cáncer, incluyendo sangre periférica y mucosa colónica normal (Kinochi et al., 1996, Cancer Letters 107, 105-108 (1996); Ogawa, et al, Nature Genetics 5, 408-412 (1993); Cui H, Science 299, 1753 (2003)), yen los tejidos normales de personas que se cree que no tienen cáncer(Cui H, et al. Nature Medicine 4-11, 1276-1280 (1998); Cui H, Science 299, 1753 (2003); Woodson K et al., JNCI 96, 407-410 (2004); Cruz-Correa Met al., Gastroenterology 126, 964-970 (2004)).

Diversos estudios de sangre periférica de población general indican que entre un 7 y un 10 % de la población presenta pérdida de impronta del IGF2 en el tejido de la mucosa colónica. Tres estudios retrospectivos indican que las probabilidades de que los pacientes con cáncer colorrectal presenten LOI del IGF2 ya sea en sangre periférica o en la mucosa colónica son significativamente mayores (entre 2-21 veces)que las probabilidades de que un grupo de controldelamismaedadsincáncerpresente LOI.Estosestudiossugierenque la LOIdel IGF2 puede predisponer a individuos por lo demás sanos a tener un cáncer colorrectal. Por lo tanto, un ensayo de riesgo basado en la detección de la LOI del IGF2 puede tener un beneficio clínico en un futuro (Cui H, et al. Nature Medicine 4-11, 12761280 (1998); Cui H, Science 14, 1753-1755 (2003); Woodson K 2004, JNCI 96, 407-410; Cruz-Correa M, Gastroenterology 126, 964-970 (2004)). Estos estudios muestran que las personas con LOI del IGF2 (también denominada biomarcador del IGF2), pueden tener hasta 20 veces más probabilidad de desarrollar cáncer colorrectal que los individuos sin el biomarcador de IGF2.

La detección de LOI del IGF2 se basa en un ensayo cuantitativo de expresión génica específica de alelo, en el que se cuantifican los transcritos procedentes de cada una de ambas copias del gen IGF2. A continuación se comparan las cantidades entre sí para determinar una relación de la expresión genética alélica, que se compara posteriormente con un valor umbral. Si la concentración del alelo menos abundante es “relativamente similar” a la concentración del alelo más abundante, entonces se determina que la impronta del IGF2 se ha perdido. Si la concentración del alelo menos abundante es “relativamente diferente” a la concentración del alelo más abundante, entonces se determina que la impronta del IGF2 está presente. Un método para medir el estado de la impronta del IGF2 en una muestra es determinar en primer lugar el genotipo o genotipos de uno o más sitios polimórficos en la región transcrita del gen IGF2. Los marcadores heterocigotos en la región transcrita del gen proporcionan marcas moleculares convenientes mediante los cuales pueden distinguirse entre sí los alelos individuales del gen IGF2 en una muestra. La transcripción de ARN a partir de cada una de las dos copias del gen IGF2 puede medirse independientemente con ensayos cuantitativos específicos de alelos. Por lo tanto, puede realizarse una comparación de la cantidad de expresión de un alelo con la cantidad de expresión del otro alelo, y puede determinarse el estado de la impronta del gen IGF2 (véase Figura 2).

El IGF2 tiene cuatro promotores, donde cada uno dirige la expresión de transcritos con corte y empalme alternativo, de manera específica al tejido (Figura 1A). Los exones 7, 8 y 9 están presentes en todos los transcritos, mientras que se ha indicado que los exones 1-6 se expresan de una manera específica al promotor. El exón 9 incluye una extensión corta de la secuencia de codificación de proteínas seguida de una región 3’ UTR considerablemente más larga. Los marcadores polimórficos en los exones 7, 8 y 9 son por lo tanto útiles en la determinación del estado de la impronta del IGF2 al permitir la detección de la expresión específica de alelos de la transcripción del IGF2 dirigida a partir de cualquiera de los cuatro promotores del IGF2.

Son conocidos para los expertos en el arte, cuatro ensayos de expresión específica de alelo que miden el estado de la impronta del IGF2. En Woodson, et al. se midió el estado de la impronta del IGF2 con una combinación de dos ensayos basados en SNP (rs680 y rs2230949) (Woodson K 2004, JNCI 96, 407-410). Ambos SNP se encuentran en el exón 9 del IGF2, pero en Woodson et al. se describe que se encuentran en desequilibrio de ligamiento mínimo. Por lo tanto, los intentos para medir la LOI de un individuo con dicha combinación de marcadores aumenta la probabilidad de que el individuo sea heterocigoto para al menos uno de los dos SNP, y por lo tanto aumenta la probabilidad de que pueda determinarse el estado de la LOI del individuo. Los autores demostraron que el primer SNP, el segundo SNP o ambos SNP eran informativos (es decir, eran heterocigotos y, por lo tanto, permitían la medición de la LOI del IGF2) en 48 de 106 pacientes evaluados (o un 45%). En Cui et al. se midió la impronta del IGF2 con una combinación de dos ensayos, uno que establecía como diana un SNP (rs680) y un segundo que medía polimorfismos de la longitud de fragmentos de restricción de una repetición de secuencias simples dentro del exón 9 del IGF2. Los autores demostraron que el SNP, la repetición, o ambos marcadores eran informativos en 191 de 421 (o en un 45 %) pacientes evaluados (Cui H, et al. Nature Medicine 4-11, 1276-1280 (1998)).

Estudios previos han demostrado que el uso de estos polimorfismos da como resultado una baja frecuencia combinada de heterocigosidad en poblaciones de pacientes y, por lo tanto, un gran número de individuos en estas poblaciones eran “no informativos”,de tal manera que no pudo determinarse el estado de la impronta de su IGF2. La presente solicitud describe un SNP de reciente descubrimiento en el exón 9 del IGF2, y el descubrimiento de combinaciones útiles de los SNP que permiten mediciones de la LOI exitosas en una mayor proporción de la población humana. La capacidad para medir la LOI utilizando estos polimorfismos en la población en general tendrá un profundo beneficio médico, actuando como la base de diversos ensayos moleculares de diagnóstico y terapéuticos.

La informatividad de un SNP dado para la detección de LOI se basa en la frecuencia de heterocigosidad del SNP dentro de una población. Además, la informatividad óptima de una combinación de diferentes SNP depende del ligamiento entre los diferentes marcadores. Por ejemplo, si dos SNP quedan dentro de un bloque de haplotipo común, el uso combinado de los dos SNP proporciona un aumento mínimo de la informatividad en relación con el uso de cualquiera de los dos SNP por sí solo. Sin embargo, si dos SNP no están en el mismo bloque de haplotipo (es decir, están en un desequilibrio de ligamiento mínimo), el uso combinado de los dos SNP proporciona un aumento efectivo de la informatividad en relación con el uso de cualquiera de los dos SNP por sísolo.

Breve resumen de la invención

La presente invención proporciona métodos para la determinación de la pérdida de impronta en el gen del Factor de Crecimiento insulínico de tipo 2 (IGF2) de un individuo. El método comprende,

detectar el genotipo del SNP del gen IGF2 en el individuo, en donde

(a): se determina el genotipo de al menos las SEQ ID NOs: 8, 11, 14, y 16, y opcionalmente también los SNP seleccionados del grupo que consiste en las SEQ ID NOs: 1, 5, 9, 10, 2, 3, 4, 6, 7, 12, 13 y 15, o

(b): se determina el genotipo de almenos las SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15 y 16,

determinando de ese modo si el individuo es heterocigoto o homocigoto en cada uno de los SNP;

cuantificando en una muestra del individuo la cantidad de ARN que comprende dos opciones polimórficas de al menos un SNP heterocigoto;

determinando la relación de la cantidad de ARN que comprende dos opciones polimórficas de al menos un SNP heterocigoto; y correlacionando la relación de ARN con la pérdida de impronta del gen IGF2.

En algunos modos de realización, al menos un SNP en la etapa de detección se selecciona del grupo que consiste en SEQ ID NO: 1, 2, 3, 4, 5, y 6.

En algunos modos de realización, la etapa de correlación además comprende correlacionar la cantidad relativa de ARN que comprende las opciones polimórficas del al menos un SNP heterocigoto, con un aumento del riesgo de cáncer, un diagnóstico o pronóstico de cáncer, o una predicción de la eficacia de un fármaco para mejorar, tratar o prevenir el cáncer.

En algunos modos de realización, al menos dos de los SNP detectados son heterocigotos y la etapa de cuantificación comprende cuantificar la cantidad de ARN que comprende dos opciones polimórficas en los al menos dos SNP heterocigotos.

En algunosmodos de realización, la muestra en una muestra de sangre,heces, raspado celular o tejido.

En algunos modos de realización, el ARN se transcribe de manera inversa en ADNc, y la cantidad de ADNc que comprende cada opción polimórfica se utiliza para determinar la cantidad de ARN que comprende las dos opciones polimórficas. En algunos modos de realización, la cantidad de ADNc específico de alelo se cuantifica en un método que comprende poner en contacto el ADNc con al menos un polinucleótido de detección específico de alelo. En algunos modos de realización, el método comprende poner en contacto el ADNc con un número suficiente de polinucleótidos de detección específicos de alelo, de tal manera que se determine la opción polimórfica para cada SNP heterocigoto del grupo. En algunos modos de realización, el método comprende poner en contacto el ADNc con un número de diferentes polinucleótidos de detección específicos de alelo, en donde el número es igual o mayor que el número de SNPheterocigotosen elgrupo,de talmanera que almenos un polinucleótidodedetección específico de alelo diferente se utiliza para detectar cada SNP heterocigoto diferente. En algunos modos de realización, el al menos un polinucleótido de detección específico de alelo se hibrida con el ADNc y se extiende de forma dependiente al modelo a través de la posición polimórfica del SNP en el ADNc.

En algunos modos de realización, el al menos un polinucleótido de detección específico de alelo comprende al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos en el extremo 3’ del polinucleótido de detección específico de alelo, en donde almenos 8 nucleótidos contiguosson o bien:

100% complementarios a al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos directamente 3’ (o tienen 2 o 3 nucleótidos 3’)de la posición polimórfica de la región del SNPmostrada en la SEQ ID NO:; o

100% idénticos a al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos directamente 5’ (o tienen 2 o 3 nucleótidos 5’) de la posición polimórfica de la región del SNP mostrada en la SEQ ID NO: [o, por ejemplo, 100%idénticos a al menos8 (porejemplo, al menos10,12,15,20)nucleótidos directamente 3’(o tienen 2

o 3 nucleótidos 3’) de la posición polimórfica del complemento de la región del SNP].

En algunos modos de realización, el al menos un polinucleótido de detección específico de alelo comprende una secuencia 100% idéntica a al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos, o el complemento de los mismos,dealmenos un SNPheterocigoto,yla secuencia consisteenalmenos8 (porejemplo,almenos10, 12, 15) nucleótidos contiguos, o el complemento de los mismos, del SNP, en donde una de las posiciones de la secuencia corresponde a la posición variable del SNP.

En algunos modos de realización, la etapa de detección comprende detectar el genotipo del SNP de cada opción polimórfica de cada uno de:

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y16.

En algunosmodos de realización, la etapa de detección comprende detectar almenos 4 (por ejemplo, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15) SNP seleccionados del grupo.

En algunos modos de realización, el método comprende además proporcionar una clasificación de riesgo de cáncer, diagnóstico de cáncer, o pronóstico en base a la etapa de correlación, y/o someter al individuo a un procedimiento de detección de enfermedades (por ejemplo, colonoscopia) en base a la etapa de correlación, y/o someter una muestra del individuo a ensayos diagnósticos o pronósticos adicionales basados en la etapa de correlación, y/o cambiar un fármaco u otro régimen de tratamiento del individuo en base a la etapa de correlación.

También se describen en la presente patente mezclas de reacción. La mezcla de reacción puede comprender, un primer polinucleótido de entre 8-100 nucleótidos, en donde el primer polinucleótido distingue entre una opción polimórfica de un primer SNP (o complemento del mismo), y la otra opción polimórfica del primer SNP (o complemento del mismo) en una reacción de hibridación, un segundo polinucleótido de entre 8-100 nucleótidos, en donde el segundo nucleótido distingue entre una opción polimórfica de un segundo SNP (o complemento del mismo) y la otra opción polimórfica del segundo SNP (o complemento del mismo), en una reacción de hibridación, y un tercer polinucleótido de entre 8-100 nucleótidos, en donde el tercer polinucleótido distingue entre una opción polimórfica de un tercer SNP (o un complemento del mismo), y la otra opción polimórfica del tercer SNP (o complemento del mismo) en una reacción de hibridación, en donde el primer y segundo y tercer SNP se selecciona del grupo que consiste en SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16, en donde al menos un SNP es 1, 2, 3, 4, 5, o 6.

Al menos uno, al menos dos, o tres del primer, segundo, y tercer polinucleótido puede comprender una secuencia 100% idéntica a al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos contiguos, o el complemento de los mismos, de la SEQ ID NO: correspondiente al primer y segundo y tercer SNP, respectivamente.

La secuencia puede consistir en al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos contiguos, o el complemento de los mismos, del SNP, en donde una de las posiciones de la secuencia corresponde a la posición variable del SNP.

La mezcla de reacción puede además comprender una muestra que comprende ácidos nucleicos de un humano.

La mezcla de reacción puede además comprender una polimerasa.

La polimerasa puede ser una polimerasa termoestable.

Al menos uno de entre el primer y segundo y tercer polinucleótidos puede ser marcado de manera que sea detectable. El marcador detectable puede ser un marcador fluorescente. Los polinucleótidos primero y segundo y tercero pueden ser marcados de manera que se puedan detectar con diferentes marcadores, de tal manera que los diferentes marcadores puedan ser detectados diferencialmente en base a diferentes longitudes de onda de la fluorescencia de losmarcadores, o a una masa diferente de losmarcadores.

La mezcla de reacción puede comprender una pluralidad de diferentes polinucleótidos de detección específicos de alelo de entre 8-100 nucleótidos, de tal manera que al menos un polinucleótido de la pluralidad distingue entre un alelo de un SNP (o complemento del mismo) y el otro alelo del SNP (o complemento del mismo) en una reacción de hibridación para cada uno de:

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16.

La mezcla de reacción puede comprender un primer polinucleótido de detección específico de alelo de entre 8-100 nucleótidos, un segundo polinucleótido de detección específico de alelo de entre 8-100 nucleótidos, un segundo polinucleótido de detección específico de alelo de entre 8-100 nucleótidos, en donde cada uno de los polinucleótidos primero,segundo ytercero comprende almenos 8 (por ejemplo, al menos 10, 12, 15, 20)nucleótidos contiguos en el extremo 3’ del polinucleótido de detección específico de alelo, en donde los al menos 8 nucleótidos contiguos son o bien:

100% complementarios a al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos directamente 3’ (o tienen 2 o 3 nucleótidos 3’) de la posición polimórfica de una región SNP; o

100%idénticos a al menos8 (porejemplo,almenos10,12,15,20)nucleótidos directamente 5’(o tienen 2

o 3 nucleótidos 5’) de la posición polimórfica de una región SNP,

en donde la región SNP correspondiente a cada uno de entre el primer, segundo y tercer polinucleótido es diferente, y las regiones SNPse seleccionan del grupo que consiste en SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16, en donde al menos una región SNP es la SEQ ID NO: 1, 2, 3, 4, 5, o 6.

La mezcla de reacción puede comprender una pluralidad de diferentes polinucleótidos de detección específicos de alelo, en donde cada uno de la pluralidad de polinucleótidos comprende al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos contiguos en el extremo 3’ del polinucleótido de detección específico de alelo, en donde los al menos 8 nucleótidos contiguos son o bien:

100%idénticosa almenos8 (porejemplo,almenos10,12,15,20)nucleótidos directamente 5’(o tienen 2

o 3 nucleótidos 5’) de la posición polimórfica de una región SNP,

En donde la pluralidad incluye un número suficiente de polinucleótidos, de talmanera que almenos un polinucleótido corresponda a cada una de las siguientes regiones SNP:

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16.

También se describen en la presente patente kits útiles para llevar a cabo los métodos de la invención. El kit puede comprender un primer polinucleótido de entre 8-100 nucleótidos, en donde el primer polinucleótido distingue entre una opción polimórfica de un primer SNP (o complemento del mismo) y la otra opción polimórfica del primer SNP (o complemento del mismo) en una reacción de hibridación, un segundo polinucleótido de entre 8-100 nucleótidos, en donde el segundo polinucleótido distingue entre una opción polimórfica de un segundo SNP (o complemento del mismo)ylaotraopciónpolimórfica delsegundoSNP(ocomplementodelmismo)enuna reacción de hibridación,un tercer polinucleótido de entre 8-100 nucleótidos, en donde el tercer polinucleótido distingue entre una opción polimórfica de un tercer SNP (o complemento delmismo) y la otra opción polimórfica del tercer SNP (o complemento del mismo) en una reacción de hibridación, en donde el primer y segundo y tercer SNP se selecciona del grupo que consiste en SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16, en donde al menos un SNP se selecciona de las SEQ ID NOs: 1, 2, 3, 4, 5, o 6.

Al menos uno, al menos dos, o los tres de entre el primer, segundo o tercer polinucleótido puede comprender una secuencia 100% idéntica a al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos contiguos, o el complemento de los mismos, de la SEQ ID NO: correspondiente al primer y segundo ytercer SNP, respectivamente.

El kit puede comprender además una polimerasa. La polimerasa puede ser una polimerasa termoestable.

El kit puede comprender una pluralidad de diferentes polinucleótidos de detección específicos de alelo de entre 8100 nucleótidos, de tal manera que al menos un polinucleótido de la pluralidad distingue entre un alelo de un SNP (o complemento del mismo) y el otro alelo del SNP (o complemento del mismo) en una reacción de hibridación para cada uno de:

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16.

El kit puede comprender:

un primer polinucleótido de detección específico de alelo de entre 8-100 nucleótidos,

un segundo polinucleótido de detección específico de alelo de entre 8-100 nucleótidos,

un tercer polinucleótido de detección específico de alelo de entre 8-100 nucleótidos,

en donde cada uno de entre el primer, segundo, y tercer polinucleótido comprende al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos contiguos en el extremo 3’ del polinucleótido de detección específico de alelo, en donde los almenos 8 nucleótidos contiguosson o bien:

o 3 nucleótidos 5’) de la posición polimórfica de una región SNP [o, por ejemplo, 100% idénticos a al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos directamente 3’ (o tienen 2 o 3 nucleótidos 3’) de la posición polimórfica del complemento de la región SNP],

en donde la región SNP correspondiente a cada uno de los polinucleótidos primero, segundo, y tercero es diferente y las regiones SNP se seleccionan del grupo que consiste en SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y16, en donde almenos una región SNP es SEQ ID NO: 1, 2, 3, 4, 5, o 6.

El kit puede además comprender una muestra que comprende ácidos nucleicos de origen humano.

El kit puede comprender una pluralidad de diferentes polinucleótidos de detección específicos de alelo diferentes, en donde cada uno de la pluralidad de polinucleótidos comprende al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos contiguos en el extremo 3’ del polinucleótido de detección específico de alelo, en donde al menos 8 nucleótidos contiguos son o bien:

o 3 nucleótidos 5’) de la posición polimórfica de una región SNP,

en donde la pluralidad incluye un número suficiente de polinucleótidos de tal manera que un polinucleótido corresponde a cada una de las siguientes regiones SNP:

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16; o SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16. También se describe en la presente patente métodos implementados en ordenador para determinar la pérdida de impronta en el gen del factor de crecimiento insulínico de tipo 2 (IGF2). El método puede comprender:

a) recibir, en un ordenador central, valores de genotipos para al menos tres SNP seleccionados del grupo que consiste en las SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16, en donde el genotipo se determina a partir de una muestra de un individuo; y

(b): recibir, en un ordenador central, un valor que representa la cantidad de ARN que comprende cada opción polimórfica de al menos un SNP heterocigoto seleccionado del grupo que consiste en las SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16, en donde el ARN procede de una muestra de un individuo; y

(c): determinar, en un ordenador central, una relación de la cantidad de ARN que comprende dos opciones polimórficas de al menos un SNP heterocigoto; y

(d): mostrar a un humano como datos de salida del ordenador central la relación del ARN o correlacionar la relación del ARN con respecto a la pérdida de impronta del gen IGF2, y opcionalmente mostrar a un humano como datos de salida el resultado de la etapa de correlación.

Al menos un SNP puede seleccionarse de la SEQ ID NO: 1, 2, 3, 4, 5, o 6. La etapa de correlación puede además comprender correlacionar la cantidad relativa de ARN que comprende las opciones polimórficas del al menos un SNP heterocigoto con un aumento del riesgo de cáncer, un diagnóstico o pronóstico de cáncer, o una predicción de la eficacia de un fármaco para mejorar, tratar o prevenir un cáncer.

La etapa de recepción (a) puede comprender recibir un valor que representa la cantidad de ARN que tiene cada opción polimórfica de cada una de

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16.

La etapa de recepción (a) puede comprender recibir un valor que representa la cantidad de ARN que tiene cada opción polimórfica de cada uno de al menos 4 (por ejemplo, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15) SNP seleccionados del grupo.

También se describe en la presente patente un producto de un programa de ordenador para determinar la pérdida de impronta en el gen del factor de crecimiento insulínico de tipo 2 (IGF2). En algunos modos de realización, el producto legible por ordenador comprende:

un medio legible por ordenador codificado con un código de programa, donde el código de programa incluye:

un código de programa para recibir los valores de genotipo para al menos tres SNP seleccionados del grupo que consiste en las SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16, en donde el genotipo se determiona a partir de una muestra procedente de un individuo;

un código de programa para recibir un valor que representa la cantidad de ARN que comprende cada opción polimórfica en al menos un SNP heterocigoto, seleccionado del grupo que consiste en las SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16, en donde el ARN procede de una muestra de un individuo;

un código de programa para determinar una relación de la cantidad de ARN que comprenden dos opciones polimórficas de al menos un SNP heterocigoto; y

opcionalmente, un código de programa para correlacionar en el ordenador central, la relación de ARN con respecto a la pérdida de impronta del gen IGF2.

Al menos un SNP puede seleccionarse de la SEQ ID NO: 1, 2, 3, 4, 5, o 6.

El código de programa para correlacionar la cantidad relativa de ARN puede comprender las opciones polimórficas del al menos un SNP heterocigoto con un aumento en el riesgo de cáncer, un diagnóstico o pronóstico de cáncer, o una predicción de la eficacia de un fármaco para mejorar, tratar o prevenir un cáncer.

El código de programa puede incluir un código de programa para recibir información que representa la presencia o ausencia de cada opción polimórfica de al menos tres SNP en el ADN genómico de la muestra; y un código de programa para determinar so el individuo es heterocigoto para al menos dos SNP.

El código de programa puede incluir un código de programa para recibir un valor que representa la cantidad de ARN que tiene cada opción polimórfica de cada uno de

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16.

El código de programa puede incluir un código de programa para recibir un valor de genotipo que representa cada uno de al menos 4 (por ejemplo, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15) SNP seleccionados del grupo.

También se describe en la presente patente un par de miembros de ácido nucleico aislados de control, sustancialmente libres de ácidos nucleicos celulares, en donde ambos miembros del par comprenden al menos dos secuencias de polimorfismo de un único nucleótido (SNP) del factor de crecimiento insulínico de tipo 2 (IGF2), en donde:

(a) un miembro del par comprende un polinucleótido que comprende un alelo de los, al menos dos, SNP del IGF2, en donde la secuencia de ácido nucleico 3’ directamente adyacente al primer sitio del SNP es sustancialmente idéntica a al menos 15 nucleótidos contiguos (por ejemplo, al menos 20, 25, o 50 nucleótidos contiguos) de la región correspondiente de la SEQ ID NO: 17, 18, 21, o 23; y la secuencia de ácidonucleico directamenteadyacentealsegundo sitiodel SNPessustancialmente idénticaa almenos 15 nucleótidos contiguos (por ejemplo, al menos 20, 25, o 50 nucleótidos contiguos) de la región correspondiente de la SEQ ID NO: 17, 18, 21, o 23; y

(b) el segundo miembro del par comprende un polinucleótido que comprende un alelo alternativo de los al menos dos SNP del IGF2; en donde la secuencia de ácido nucleico 3’ directamente adyacente al primer sitio del SNP es sustancialmente idéntica a al menos 15 nucleótidos contiguos (por ejemplo, al menos 20, 25, o 50 nucleótidos contiguos) de la correspondiente región de la SEQ ID NO: 17, 18, 21, o 23, y la secuencia de ácido nucleico 3’ directamente adyacente al segundo sitio del SNP es sustancialmente idéntica a al menos 15 nucleótidos contiguos (por ejemplo, al menos 20, 25, o 50 nucleótidos contiguos) de la región correspondiente de la SEQ ID NO: 17, 18, 21, o 23.

En elpar,almenosunodelosSNPpuedeseleccionarsedel grupoque consisteenel SNPsegún se muestra en las SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16. Al menos dos de los SNP pueden ser seleccionados del grupo que consiste en el SNP según se muestra en las SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15,y16.Al menos uno de losSNPpuede serseleccionadodel grupo que consiste en el SNPsegún semuestra en las SEQ ID NOs: 1, 2, 3, 4, 5, y

En el par, los al menos dos SNP del IGF2 pueden comprender tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince o dieciséis SNP del IGF2.

En el par de ácidos nucleicos de control, los SNP pueden comprender el SNPsegún se muestra en las:

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16;

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16;

SEQ ID NOs. 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID NOs. 1, 2, 4, 5, 8, 9, 10,12, 13, 14, 15, y 16.

En algunos pares de control, el primer miembro del par puede comprender un polinucleótido que tiene al menos 8 nucleótidos contiguos (por ejemplo, al menos 10, 12. 15, 20, o 25 nucleótidos contiguos) de un alelo de las SEQ ID NOs: 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,o16,oelcomplemento delmismo; yel segundo miembro del par comprende un polinucleótido que tiene al menos 8 nucleótidos contiguos (por ejemplo, al menos 10, 12, 15, 20, o 25 nucleótidos contiguos) del alelo alternativo de las SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, o 16, o el complemento de las mismas.

Uno de los miembros del par puede comprender al menos dos alelos menores de los SNP.

El par de miembros aislados de ácido nucleico puede ser ARN.

El par de miembros aislados de ácido nucleico puede ser ADN.

El polinucleótido de un miembro de los pares puede estar enlazado de manera operativa a un promotor y el polinucleótido delsegundo miembro del par está enlazado de manera operativa a un promotor.

Los miembros del par pueden comprender menos de 500 nucleótidos de la secuenciamostrada enSEQ ID NO: 22.

Los miembros del par pueden estar separados. De forma alternativa, los miembros del par pueden estar juntos en una mezcla.

También se describe en la presente patente una mezcla que comprende un par de miembros de ácido nucleico de control aislados, según se describe en la presente patente, por ejemplo, un par de ácidos nucleicos descritos anteriormente en la presente patente. Los miembros del par pueden estar presentes en cantidades equimolares.

La mezcla puede además comprender un segundo par de ácidos nucleicos aislados, sustancialmente libre de ácidos nucleicos celulares, en donde ambos miembros del segundo par comprenden al menos una secuencia de SNP del IGF2, y en donde dicha al menos una secuencia de SNP del IGF2 en el segundo par es diferente de los SNP del IGF2 del primer par; y

(c): un miembro del segundo par comprende un alelo del al menos un SNP del IGF2, en donde la secuencia del ácido nucleico 3’ directamente adyacente al sitio del SNP es sustancialmente idéntico a al menos 15 nucleótidos contiguos (por ejemplo, al menos 20, 25, o 50 nucleótidos contiguos) de la región correspondiente de las SEQ ID NOs: 17, 18, 21, o 23 de la correspondiente región de las SEQ ID NOs: 17, 18, 21, o 23; y

(d): el otro miembro del segundo par comprende un alelo alternativo de al menos un SNP del IGF2; en donde la secuencia de ácido nucleico 3’ directamente adyacente al sitio del SNP es sustancialmente idéntica a al menos 15 nucleótidos contiguos (por ejemplo, al menos 20, 25, o 50 nucleótidos contiguos) de la correspondiente región de SEQ ID NOs: 17, 18, 21, o 23.

Un kit puede comprender el par de miembros de ácido nucleico aislados de cualquier par de control de ácidos nucleicos tal como se describe en la presente patente, por ejemplo, los pares descritos anteriormente en el presente documento. Un miembro del par puede encontrarse en un recipiente separado sin el segundo miembro del par. Un kit puede comprender una mezcla que comprende al menos un par de control de ácidos nucleicos.

El kit puede además comprender un segundo par de ácidos nucleicos aislados, sustancialmente libres de ácidos nucleicos celulares, en donde ambos miembros del segundo par comprende al menos una secuencia del SNP del IGF2, y en donde la al menos una secuencia del SNP del IGF2 en el segundo par es diferente de los SNP del IGF2 en el primerpar;y(c)un miembro delsegundo parcomprende unalelodel almenos un SNPdelIGF2,en donde la secuencia de ácido nucleico 3’ directamente adyacente al sitio del SNP es sustancialmente idéntica a al menos 15 nucleótidos contiguos (por ejemplo, al menos 20, 25, o 50 nucleótidos contiguos) de la correspondiente región de SEQ ID NOs: 17, 18,21, o 23; y (d) el otro miembro delsegundo par comprende un alelo alternativo del almenos un SNPdel IGF2;en dondelasecuenciade ácidonucleico directamente adyacente alsitio del SNPessustancialmente idéntica a al menos 15 nucleótidos contiguos (por ejemplo, al menos 20, 25, o 50 nucleótidos contiguos) de la correspondiente región de SEQ ID NOs: 17, 18, 21, o 23. En algunos modos de realización, el segundo par de ácidos nucleicos aislados se encuentra en un recipiente separado del primer par de ácidos nucleicos.

También se describe en la presente patente un método para determinar la pérdida de impronta (LOI) en un gen IGF2 de un individuo, donde elmétodo comprende,

(a): cuantificar en una muestra procedente del individuo, la cantidad de ARN del IGF2 de la copia maternal (primera) y paternal (segunda), en donde la etapa de cuantificación comprende poner en contacto la muestra de ARN, o una muestra de ADNc del mismo, con uno o más oligonucleótidos que distinguen entre un primer posible alelo del SNP y un segundo posible alelo del SNP en la primera y segunda copia, respectivamente; y

(b): proporcionar una mezcla de control que comprende una relación de un par de control de ácidos nucleicos según se describe en la presente patente que comprenden polinucleótidos con el primer posible alelo del SNP y el segundo posible alelo del SNP de la etapa (a);

(c): cuantificar en la mezcla de control la cantidad de cada miembro del par de ácidos nucleicos;

(d): comparar la relación del par de ácidos nucleicos presentes en la mezcla de control medida en la etapa

(c): con las cantidades en la muestra medidas en la etapa (a) de la primera y segunda copia de ARN del IGF2, o una muestra de ADNc del mismo, determinando de ese modo la presencia o ausencia de LOI del IGF2.

También se describe en la presente patente un método para proporcionar un estándar de control en un ensayo de pérdida de impronta (LOI) del IGF2 para confirmar la viabilidad de las condiciones de reacción, donde el método comprende proporcionar una mezcla de controlque comprendeuna relaciónconocidade un parde ácidos nucleicos de control descritos en la presente patente; y cuantificar en la mezcla de control la relación medida de cada miembro del par de ácido nucleico, confirmando de ese modo la viabilidad de las condiciones de reacción del ensayo.

Definiciones

Una “polimerasa termoestable” hace referencia a una polimerasa útil para aplicaciones de PCR. Una polimerasa termoestable puede generalmente calentarse a 75 ºC repetidamente (por ejemplo, al menos 20 veces durante un minuto en cada ocasión), y conservar al menos un 80 % de su actividad original. Ejemplos de polimerasas de ese tipo incluyen, pero no se limitan a, la Taq polimerasa.

Un “polimorfismo de un único nucleótido” o “SNP” hace referencia a un sitio de un nucleótido que varía entre los alelos.

Un “alelo” hace referencia a un miembro de un par o conjunto de formas diferentes de un gen. En un organismo diploide, un individuo tiene dos copias de cada gen autosómico. Para un polimorfismo de un único nucleótido, un individuo tiene dos alelos diferentesdel nucleótido polimórfico si el genotipo en el nucleótido polimórfico es diferente en una copia del gen a la otra copia del gen (es decir, el individuo es heterocigoto para el nucleótido polimórfico). Si un individuo tiene el mismo genotipo en el nucleótido polimórfico en ambas copias del gen (es decir, el individuo es homocigoto para el nucleótido polimórfico), entonces el individuo tiene dos copias del mismo alelo del nucleótido polimórfico. Un individuo determinado puede ser homocigoto para un nucleótido polimórfico dentro de un gen (dos copiasdelmismo alelo delnucleótido polimórfico),yheterocigoto para un nucleótido polimórficodiferente dentro del mismo gen (dos alelos diferentes del nucleótido polimórfico).

“Hibridación” hace referencia a la formación de una estructura doble mediante dos ácidos nucleicos monocatenarios debido al apareamiento de bases complementario. La hibridación puede producirse entre cadenas de ácido nucleico exactamente complementarias o entre cadenas de ácido nucleico que contienen regiones menores de errores de apareamiento.

“Secuencia diana” o “región diana” hace referencia a una región de un ácido nucleico que va a ser analizada y comprende elsitio polimórfico de interés.

Tal como se utiliza en la presente patente, los términos “ácido nucleico”, “polinucleótido” y “oligonucleótido” hacen referencia a regiones de ácido nucleico, segmentos de ácido nucleico, cebadores, sondas, amplicones y fragmentos oligoméricos. Los términos no se encuentran limitados por la longitud y son genéricos para polímeros lineales de polidesoxirribonucleótidos (que contienen 2-desoxi-D-ribosa), polirribonucleótidos (que contienen D-ribosa) y cualquier otro N-glucósido de una base de purina o pirimidina, o bases de purinas o pirimidinas modificadas. Estos términos incluyen ADN bicatenario y monocatenario, además de ARN bicatenario y monocatenario.

Un ácido nucleico, polinucleótido u oligonucleótido puede comprender, por ejemplo, enlaces fosfodiéster o enlaces modificados incluyendo, pero sin limitarse a, enlaces fosfotriéster, fosforamidato, siloxano, carbonato, carboximetiléster, acetamidato, carbamato, tioéter, fosforamidato unido por puente, metilenfosfonato unido por puente, fosforotioato, metilfosfonato, fosforoditioato, enlaces de fosforotioato o sulfona unidos por puente, y combinaciones de dichos enlaces.

Un ácido nucleico, polinucleótido u oligonucleótido puede comprender las cinco bases de origen biológico (adenina, guanina, timina, citosina y uracilo) y/o bases distintas de las cinco bases de origen biológico. Por ejemplo, un polinucleótido de la invención puede contener una o más fracciones de bases modificadas, no estándar o derivadas, incluyendo, pero sin limitarse a, N6-metil-adenina, N6-terc-butil-bencil-adenina, imidazol, imidazoles sustituidos, 5fluorouracilo, 5-bromouracilo, 5-clorouracilo, 5-yodouracilo, hipoxantina, xantina, 4-acetilcitosina, 5(carboxihidroximetil)uracilo, 5-carboximetilaminometil-2-tiouridina, 5-carboximetilaminometiluracilo, dihidrouracilo, beta-D-galactosilqueosina, inosina, N6-isopenteniladenina, 1-metilguanina, 1-metilinosina, 2,2-dimetilguanina, 2metiladenina, 2-metilguanina, 3-metilcitosina, 5-metilcitosina, N6-metiladenina, 7-metilguanina, 5metilaminometiluracilo, 5-metoxiaminometil-2-tiouracilo, beta-D manosilqueosina, 5’-metoxicarboximetiluracilo, 5metoxiuracilo, 2-metiltio-N6-isopenteniladenina, ácido uracil-5-oxiacético (v), wibutoxosina, pseudouracilo, queosina, 2-tiocitosina, 5-metil-2-tiouracilo, 2-tiouracilo, 4-tiouracilo, metiléster del ácido uracil-5-oxiacético, 3-(3-amino-3-N-2carboxipropil)uracilo, (acp3)w, 2,6-diaminopurina y 5-propinil pirimidina. Otros ejemplos de fracciones de bases modificadas, no estándar o derivadas pueden encontrarse en las Patentes de Estados Unidos Nos. 6.001.611; 5.955.589; 5.844.106; 5.789.562; 5.750.343; 5.728.525 y 5.679.785.

Además, un ácido nucleico, polinucleótido u oligonucleótido puede comprender una o más fracciones de azúcares modificados incluyendo, pero sin limitarse a, arabinosa, 2-fluoroarabinosa, xilulosa, y una hexosa.

“Bloque de haplotipos” hace referencia a una región de un cromosoma que contiene uno o más sitios polimórficos (por ejemplo, de 1-10) que tienden a heredarse juntos. En otras palabras, las combinaciones de formas polimórficas en los sitios polimórficos dentro de un bloque se segregan conjuntamente en una población con mayor frecuencia que las combinaciones de sitios polimórficos que tienen lugar en diferentes bloques de haplotipos. Los sitios polimórficosdentrode un bloquedehaplotipos tiendena estaren desequilibrio deligamientoentre sí.A menudo, los sitios polimórficos que definen un bloque de haplotipos son sitios polimórficos comunes. Algunos bloques de haplotipos contienen un sitio polimórfico que no segrega conjuntamente con sitios polimórficos adyacentes en una población de individuos.

“Desequilibrio de ligamiento” hace referencia a la segregación preferencial de una forma polimórfica en particular con otra forma polimórfica en una localización cromosómica diferente, con mayor frecuencia de lo que se esperaría por mera casualidad. El desequilibrio de ligamiento también puede hacer referencia a una situación en la que un rasgo fenotípico muestra una segregación preferencial con una forma polimórfica en particular u otro rasgo fenotípico, con mayor frecuencia de la que se esperaría pormera casualidad.

Breve descripción de los dibujos

La Figura 1 ilustra la estructura del gen IGF2. La barra de escala encima del diagrama génico está dibujada en incrementos de 1 kb y representa la localización de IGF2 en el cromosoma 11 (construcción de NCBI 36). La barra de escala también está presente en la Figura 4. Las flechas en la Figura 1A representan los cuatro promotores de IGF2. Los exones 1 a 9 están indicados debajo del diagrama génico. Los exones 1 a 6 sombreados en negro no codifican proteína en la mayoría de los transcritos de IGF2. Los exones 7 y 8 en blanco 55 codifican proteína, como lo hace la región blanca pequeña del exón 9. La región sombreada en negro del exón 9 es la 3’ UTR.

La Figura 2 ilustra una estrategia básica para determinar la LOI del IGF2 en una muestra biológica. El ADN genómico y el ARN total o poliadenilado se aíslan a partir de una muestra biológica (por ejemplo, sangre periférica, células mononucleares de sangre periférica, biopsia o raspado celular del colon, heces, etc.) de un individuo. La muestra de ADN genómico se utiliza para el genotipado de uno o más marcadores polimórficos (Ensayo de SNP de ADN). Esta etapa determina si el individuo es heterocigoto para un SNP específico o una combinación de SNP específica. Cualquier SNP, o combinación de SNP, que se determine como heterocigoto puede utilizarse para el análisis de la expresión específica de alelos del gen IGF2 en la muestra de ARN coincidente (ensayo de SNP de ARN).En el ejemplo mostrado,se determinó mediante un ensayo de genotipado de ADN diferenciador de alelos que un individuo era homocigoto para los SNP hipotéticos 1, 3, 4 y 6, y heterocigoto para los SNP hipotéticos 2 y 5. El ADNc se amplifica a partir de la región relevante del transcrito del IGF2 utilizando transcriptasa inversa estándar y métodos de PCR, de tal manera que se amplifiquen los productos de PCR que incluyen al menos los SNP 2 y 5. La expresión de cada una de las dos copias del gen IGF2 se mide de manera independiente, utilizando el ADNc generado con un ensayo cuantitativo de expresión génica específica de alelo, y que puede diferenciar suficientemente entre los dos alelos del gen. Se realiza una comparación entre la cantidad de expresión de un alelo en relación a la cantidad de expresión del otro alelo, y se determina el estado de la impronta del gen IGF2. Pueden realizarse de forma simultánea ensayos que diferencian los SNP 2 y 5, y se pueden comparar las relaciones de la expresión específica de alelo obtenidas para cada ensayo con la finalidad de mejorar la precisión.

La figura 3 ilustra la informatividad de las combinaciones de SNP en el exón 9 del IGF2. Se representa gráficamente el porcentaje de individuos que son heterocigotos (informativos) para un SNP (barras huecas), dos SNP (barras grises) o más de dos SNP (barras negras) para el panel de muestras Afroamericanas (AA) genotipadas para un primer panel de SNP, el panel de muestras Caucásicas (CAU) genotipadas para un segundo panel de SNP, el panel de muestras de ascendencia mejicana (MEX) genotipadas para un tercer panel de SNP, el panel de muestras Japonesas (JPN) genotipadas para un cuarto panel de SNPy el panel de muestras Chino (CHI) genotipadas para un quinto panel de SNP.Se realizó el genotipado de un total de 96 muestras del panelAfroamericano,207 muestras del panel Caucásico, 96 muestras del panel de ascendencia Mejicana, 88 muestras del panel Japonés y 84 muestras del panel Chino. Únicamente las muestras que fueron genotipadas con éxito mediante un ensayo de extensión de cebador con un único nucleótido para todos los SNP se incluyen en el cálculo del porcentaje de informatividad. El número de muestras incluidas en cada grupo étnico se encuentra indicado debajo del eje X (n). Las barras de error indican un intervalo de confianza del 95%. Las combinaciones de SNP para cada población étnica incluían los SNP representados por las SEQ ID NOs: 1, 2, 3, 4, 12, 13, 15 y 16 para el primer panel genotipado en el panel de muestras Afroamericanas: SEQ ID NOs: 5, 8, 9, 10, 12, 15 y 16 para el segundo panel de SNP genotipados en el panel de muestras Caucásicas; SEQ ID NOs: 1, 7, 9, 10, 11, 12, 14, 15 y 16 para el tercer panel de SNP genotipadosen el panel de muestras de ascendencia Mejicana; SEQ ID NOs:10, 12, 14 y16 para el cuarto panel de SNP genotipados en el panel de muestras Japonesas; y SEQ ID NOs: 6, 8, 12 y 16 para el quinto panel de SNP genotipado en el panel de muestras Chinas.

La figura 4 ilustra la informatividad de diversas combinaciones óptimas de SNP en el exón 9 del IGF2. El porcentaje de individuos que son heterocigotos (informativos) para uno o más SNP dentro de cada combinación de SNP, se representan gráficamente para el panel de muestras Afroamericanas (AA), el panel de muestras Caucásicas (CAU), el panelde muestras de ascendencia Mejicana (MEX),el panelde muestras japonesas (JPN),el panelde muestras Chinas (CHI) y todas las muestras genotipadas combinadas (General). Únicamente las muestras que fueron genotipadas con éxito mediante un ensayo de extensión de cebador de un único nucleótido para todos los SNP, son incluidas en el cálculo del porcentaje de informatividad. Los paneles de SNP se seleccionaron en base a la identificación de los SNP comunes a todas las combinaciones de informatividad máxima de 15, 14, 13, 12, 11 o 10 SNP a través de todas las muestras (en general). Todos los porcentajes se proporcionan en la Tabla 4. Las SEQ ID NOs para losSNPincluidos en cada panelse detallan en la Tabla 5.

La Figura 5 ilustra el uso de un ensayo basado en enzimas de restricción para el genotipado del SNP correspondiente a la SEQ ID NO: 8. El nucleótido polimórfico se localiza dentro de la secuencia de reconocimiento de dos enzimas de restricción. Apa I reconoce y escinde la secuencia cuando está presente el alelo de “G”, y Ava II reconoce y escinde la secuencia cuando está presente el alelo de “A”. Se amplificó un amplicón de PCR que incluía la SEQ ID NO: 8 de tres muestras de ADN genómico independientes obtenidas de tres individuos (Muestras A, B y C). Los amplicones fueron digeridos con Apa I o Ava II o una combinación de ambas enzimas (Doble). La digestión mediante Apa I sólo indica que el individuo es homocigoto para el alelo de G (Muestra B), la digestión mediante Ava II solo indica que el individuo es homocigoto para el alelo de A (Muestra C), y la digestión por parte de ambas enzimas indica que el individuo es heterocigoto para el SNP (Muestra A).

La Figura 6 ilustra el uso de un método basado en enzimas de restricción para detectar la LOI del IGF2. Se extrajo el ARN total de tres individuos que son heterocigotos para la SEQ ID NO: 8. La región del 3’ UTR del exón 9 del gen

IGF2, que incluye la SEQ IF NO:8, se amplificó mediante RT-PCR a partir de cada muestra. Los amplicones de ADNc fueron digeridos con Apa I o Ava II o una combinación de ambas enzimas, tal como se indica por encima de cada carril. Los productos digeridos se resolvieron en un Bioanalizador Agilent, y se determinaron las concentraciones de los fragmentos cortados y no cortados. La cantidad de fragmentos cortados por Apa I representa la proporción de ADNc que incluye el alelo de “G”. La cantidad de fragmentos cortados por Ava II representa la proporción de ADNc que incluye el alelo de “A”. Por lo tanto, la relación de fragmentos cortados por Apa I y fragmentos cortados por Ava II indican la relación relativa de la expresión de los dos alelos en la muestra de ARN original. La relación G:A calculada se muestra debajo de cada triplete de carriles que representa cada muestra. La Muestra 2 expresa exclusivamente el alelo de “A” y por lo tanto la impronta de IGF2 estaba presente. La muestra 1 expresa ambas copias del gen IGF2, con una relación de G:A de 0,53 y por tanto muestra una LOI del IGF2. La muestra 3 expresa cantidades detectables de ambas copias del gen IGF2, con una relación de G:A de 0,27, lo que podría considerarse una marca de límite para el estado de la impronta (cerca del umbral de la relación de 0,33 para determinar una LOI).

La Figura 7 representa en un diagrama un método para la detección específica de alelo de un SNP utilizando una estrategia de extensión de cebadores de un único nucleótido. El SNP representado por la SEQ ID NO: 8 y su secuencia de ADN circundante, se muestran como un ejemplo (“secuencia de amplicón de PCR”). La posición del nucleótido de SEQ ID NO: 8 se encuentra indicada por la flecha marcada con “SEQ ID NO: 8”. La secuencia del polinucleótido utilizado para la extensión de cebadores de un único nucleótido se indica mediante la llave marcada con “Cebador”. El amplicón de ADN de la PCR (o, de forma alternativa, un amplicón de ADNc de RT-PCR) que incluye la secuencia de interés, se amplifica a partir de la muestra de ADN o ARN genómicoque va a ser sometida a ensayo. Se añade un cebador al producto de PCR purificado (o, de forma alternativa de RT-PCR) que hibrida con su nucleótido3’terminal,complementarioalnucleótido del molde,1base conelextremo3’del nucleótidopolimórficoa ser genotipado. Se lleva a cabo una extensión de cebadores de un único nucleótido utilizando ADN polimerasa termoestable y ddNTP marcados diferencialmente con fluorescencia. En este ejemplo, se añade o bien ddGTP marcado con dR110, o bien ddATP marcado con dR6G al extremo 3’ del cebador. Estos polinucleótidos marcados se resuelven entonces, y se calculan las áreas de pico representativas de cada posible nucleótido incorporado. Las áreas de pico se comparan para determinar el genotipo del individuo en esa posición del SNP (o, de manera alternativa para determinar la relación de la expresión génica específica de alelo).

La Figura 8 ilustra el uso del ensayo de extensión de cebadores de un único nucleótido descrito en la Figura 7 para realizar el genotipado de tres individuos para la SEQ ID NO: 8. Se realizó el genotipado de los mismos tres individuos que se sometieron a ensayo para la LOI del IGF2 mediante ensayo basado en enzimas de restricción, mostrado en la Figura 6. La figura muestra los cromatogramas resultantes para cada muestra a después de la resolución electroforética y detección de picos utilizando un Analizador Genético ABI 3730XL y el software Gene Mapper. Tal como era de esperar, se obtienen picos que representan ambos alelos de SEQ ID NO: 8 en proporciones relativamente iguales, lo que confirma que los tres individuos son heterocigotos para la SEQ ID NO: 8 y demuestra la concordancia entre los resultados obtenidos por el método basado en enzimas de restricción y el método basado en la extensión de cebadores de un único nucleótido.

La Figura 9 ilustra la aplicación del método basado en la extensión de cebadores de un único nucleótido para detectar la LOI del IGF2. La región que incluye la SEQ ID NO: 8 se amplificó por RT-PCR a partir de una muestra de ARN total obtenida de cada uno de los tres individuos genotipados en la Figura 8. Los productos del ADNc obtenidos se purificaron y se analizaron tal como se representa mediante un diagrama en la Figura 7. La figura muestra los cromatogramas resultantes para cada muestra después de la resolución electroforética y detección de picos utilizando un Analizador Genético ABI 3730XL y el software Gene Mapper. Para cada muestra, se calcularon y se compararon entre sí las áreas de pico que representan cada uno de los dos alelos posibles. Las relaciones G:A calculadas se indican a la derecha de cada cromatograma. De forma coherente con los resultados mostrados en la Figura 6, se determinó que las muestras 1 y 3 mostraban una LOI del IGF2, y se determinó que la muestra 2 mostraba una impronta normal del IGF2.

La Figura 10 ilustra la linealidad analítica cuantitativa de ensayos de extensión de cebadores de un único nucleótido desarrollados para 8 SNP independientes: SEQ ID NO: 8 (A), SEQ ID NO: 2 (B), SEQ ID NO: 9 (C), SEQ ID NO:10 (D), SEQ ID NO:5 (E), SEQ ID NO: 7 (F), SEQ ID NO: 15 (G) y SEQ ID NO:16 (H). Para cada ensayo de los 8 ensayos, dos amplicones que tenían como diana el 3’ UTR del exón 9 del gen IGF2 se amplificaron por separado a partir de las muestras de ADN genómico de dos individuos; un homocigoto para un alelo del SNP y el otro homocigoto para el otro alelo del SNP (es decir, se obtuvo un total de 16 amplicones que representan 8 pares de alelos). Los 16 productos de PCR fueron purificados y cuantificados. Para cada uno de los 8 SNP, dos productos de PCR (uno que contenía un alelo (alelo 1) y el otro que contenía el otro alelo (alelo 2) de un SNP en particular) se combinaron en las siguientes 11 relaciones (o puntos de dilución) del alelo 1 al alelo 2; 1:10, 1:6, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 6:1, y 10:1. Para cada uno de los 8 SNP, se realizó un ensayo de extensión de cebadores de un único nucleótido por triplicado en cada punto de dilución. Se calcularon las relaciones de las áreas de pico que representan cada uno de los dos posibles alelos para cada punto de dilución (eje Y) y se compararon con la relación de entrada conocida de cada par de alelos (eje X). Los valores se representaron gráficamente en una escala log10. El R2 y el gradiente para cada ensayo se muestran en la Tabla 6.

La Figura 11 ilustra la linealidad analítica cuantitativa de los ensayos de extensión de cebadores desarrollados para 5 SNP independientes: SEQ ID NO: 3 (A), SEQ ID NO:4 (B), SEQ ID NO:6 (C), SEQ ID NO:11 (D) y SEQ ID NO:14 (E). Para cada ensayo, se amplificaron por separado los productos de la PCR a partir de muestras de ADN genómico obtenidas de dos individuos; uno homocigoto para un alelo del SNP y el otro homocigoto para el otro alelo del SNP.Los productos de la PCR fueron purificados y cuantificados. Para cada uno de los 8 SNP, dos productos de la PCR (uno amplificado a partir de la muestra de ADN, homocigoto para un alelo, y el otro amplificado a partir de la muestra de ADN homocigoto para el otro alelo) se combinaron en las siguientes relaciones del alelo 1 al alelo 2; 1:10, 1:6, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 6:1, y 10:1. Para cada uno de los 8 SNP, el ensayo de extensión de cebadoresde un único nucleótidoserealizó portriplicado en cada puntode dilución.Se calcularonlasrelacionesde las áreas de pico que representan cada uno de los dos posibles alelos (eje Y) y se compararon con la relación de entrada conocida de cada par de alelos (eje X). Los valoresse representan en una escala log10. El R2y el gradiente para cada ensayo se muestran en la Tabla 6.

La Figura 12 ilustra el uso de un ensayo multiplex para determinar el estado del genotipo y la impronta del IGF2. La Figura 12A muestra un cromatograma generado por el software GeneMapper para un ensayo de genotipado multiplex de los productos de la PCR generados a partir del ADN genómico obtenido de una muestra de sangre de un individuo (Muestra A en la Tabla 7). El ensayo determina el estado del genotipo y la impronta en las posiciones de SNP representadas por las SEQ ID NOs: 1, 2, 3, 7, 8, 10, 11, 12, 15 y 16. En la figura, los picos están marcados mediante una correspondiente SEQ ID NO, seguidos por la secuencia de un único nucleótido entre paréntesis. Por ejemplo, los picos marcados como 12 (C) y 12 (T) indican que la muestra es heterocigota (C/T) para el SNP representado por la SEQ ID NO: 12. La muestra es heterocigota, y por tanto es informativa, en las posiciones del SNP representadas por la SEQ ID NO: 3, 11 y 12. Los picos que representan estas posiciones heterocigotas se encuentran destacadas por llaves bajo el cromatograma de la Figura 12A. La Figura 12B muestra un cromatograma generado mediante GeneMapper para un ensayo de impronta multiplex de los productos de la PCR generados a partir del ADNc amplificado a partir del ARN total obtenido de una muestra de sangre del mismo individuo que en la Figura 12A (Muestra A en la Tabla 7). Los picos están marcados como en la Figura 12A. Se observa que la muestra presenta una impronta normal (es decir, expresión monoalélica) del IGF2, ya que solamente se detecta un único pico apra las posiciones del SNP representadas por las SEQ ID NOs: 3, 11 y 12. Por ejemplo, se detecta el alelo de C de la SEQ ID NO: 12, pero el alelo de T no se detecta.

La Figura 13. Diagrama de los detalles del ensayo de LOI del IGF2 en relación a los controles Synth1 y Synth2. 13

A. Diagrama del gen IGF2. Los promotores potenciales están indicados mediante flechas marcadas con Promotor 1, P0, P2, P3 o P4. Los exones potenciales transcritos se encuentran indicados por flechas de bloque conectadas por una línea de puntos que representa regiones de secuencia intrónica. Las regiones de la secuencia exónica no traducidas están indicadas mediante flechas de bloque rellenas, y las regiones de la secuencia exónica traducidas están indicadas mediante flechas huecas. La barra de escala en la parte superior del diagrama se muestra en incrementos de 1000 pares de bases (Kb). 13 B. Vista alargada de la región del ácido nucleico Synth1 (o Synth2). La secuencia de ácido nucleico Synth1 (o Synth2) incluye los 21 pares de bases más hacia el extremo 3’ del exón 8 inmediatamente seguida de la secuencia del exón 9. Los extremos 5’ y 3’ del Synth1 (o Synth2) incluyen las secuencias de reconocimiento de la enzima de restricción Not I que se incluyeron para permitir el ligamiento de las secuencias en un vector de transcripción. La región de la secuencia de repeticiones CA presente en el exón 9 del IGF2 fue omitida de la secuencia de Synth1 (o Synth2). Los sitios de hibridación de cuatro cebadores dentro de la región Synth1 (o Synth2) (u opcionalmente, dentro de la región del ARNm del IGF2 están indicados mediante puntas de flechas (cebadores RT). Estos cebadores RT se utilizan para realizar la transcripción inversa de la primera cadena de ADNc de los ARN IVT de Synth1 o Synth2 (o, de manera opcional, del ARN total obtenido de una muestra biológica humana). La barra de escala se muestra en incrementos de 500 pares de bases. 13 C. Las moléculas de ADNc de la primera cadena generada por estas reacciones RT se encuentran indicadas mediante líneas de puntos. 13 D. Después de la transcripción inversa, el ADNc de la primera cadena se utiliza como molde para la amplificación por PCR de la primera ronda de cuatro amplicones independientes. Los sitios de hibridación de cuatro pares de cebadores en relación al ADNc de la primera cadena generado, se indican mediante puntas de flechas. Las líneas continuas que conectan los pares de cebadores representan el amplicón de PCR producido en cada reacción de amplificación por PCR de la primera ronda. El cebador señalado por el recuadro hueco incluye la secuencia de extensión de la unión de corte y empalme del exón 8-9. 13 E. Los amplicones producidos en la amplificación por PCR de la primera ronda se utilizan como moldes para la amplificación de cuatro amplicones anidados. Los sitios de hibridación de los cuatro pares de cebadores en relación al ADNc de la primera cadena que se ha generado, se encuentran indicados mediante puntas de flechas. Las líneas continuas que conectar los pares de cebadores representan el amplicon de la PCR producido en cada reacción de amplificación por PCR de la segunda ronda. 13 F. Cada uno de los cuatro amplicones generados por la reacción por PCR de la segunda ronda, incluye una o más de las posiciones del SNP representadas por las SEQ ID NOs.:1-16. La posición de cada SNP está indicada por un rombo.

Figura 14. Uso de controles de ADN para determinar la linealidad cuantitativa de un ensayo de LOI del IGF2. Se realizaronmezclas depEZSynth1ypEZ-Synth2 en lassiguientesrelaciones:8:1,6:1,4:1,3:1,2:1,1:1,1:2,1:3,1:4,

1:6 y 1:8 (Synth1:Synth2). Se diseñaron cuatro amplicones de PCR no solapados para amplificar las regiones transcritas del exón 9 del IGF2 que incluían los 16 nucleótidos de SNP. Los amplicones obtenidos a partir de las mezclas de la relación Synth1/Synth2 se utilizaron como molde para el ensayo multiplex de extensión de cebadores de un único nucleótido descrito en el Ejemplo 1. Los ensayos se realizaron por triplicado, y se calcularon las áreas de pico medias para cada pico. La relación de entrada conocida del molde Synth1:Synth2 se encuentra representada en el eje X. La media de la relación medida de las áreas de pico que representan el alelo de Synth 1: el alelo de Synth2 se encuentra representada en el eje Y. Las barras de error indican más / menos una desviación estándar a través de las mediciones por triplicado. Todos los valores de los puntos de datos de media se multiplicaron por un factor de normalización común que ajusta el valor medido para el punto de datos de entrada en relación 1:1 conocido a igual a 1,0 exactamente. Se muestran los resultados de ensayos que utilizan los SNP representados por la SEQ ID NO: 7 dentro del amplicón 1 (A), SEQ ID NO: 5 dentro del amplicón 2 (B), SEQ ID NO: 1 dentro del amplicón 3 (C) ySEQ ID NO: 13 dentro del amplicón 4 (D).

Figura 15. Uso de controles de ARN para determinar la linealidad cuantitativa de un ensayo de LOI del IGF2. Se mezcló ARN IVT obtenido a partir de pEZ-Synth1 con ARN IVT obtenido a partir de pEZ-Synth2 en relaciones que incluyen 8:1, 6:1, 4:1, 3:1, 2:1, 1:1, 1:2, 1:3, 1:4, 1:6 and 1:8 (Synth1:Synth2). Un total de 120 pg de la mezcla de ARN IVT de Synth1:Synth2 (es decir, la cantidad de ARN de control IVT obtenido a partir de pEZ-Synth1 más la cantidad de ARN de control IVT obtenido a partir de pEZ-Synth2 fue igual a 120 pg), se añadieron a 500 ng de ARN de levadura. Esta mezcla de ARN fue utilizada como un molde para la amplificación por RT-PCR de los cuatro amplicones descritos en la Figura 13E. Los amplicones obtenidos a partir de las mezclas de la relación Synth1/Synth2 se utilizaron como moldes para el ensayo multiplex de extensión de cebadores de un único nucleótido descrito en el Ejemplo 1. Los ensayos fueron realizados por triplicado, y se calcularon las áreas de pico de media para cada. La relación de entrada conocida del molde de ARN IVT de Synth1:Synth2 se encuentra representado en el eje X. La relación medida media del área de pico que representa el alelo de Synth 1 allele: el alelo de Synth2 se encuentra representado en el eje Y. Las barras de error indican más / menos una desviación estándar a lo largo de las mediciones triplicadas. Todos los valores de puntos de datos de media se multiplicaron por un factor de normalización común que ajusta el valor medido para el punto de datos de entrada en una relación

1:1 conocido para queseaigualaexactamente 1,0. Se muestranlosresultadosdelosensayosqueutilizan losSNP representados por las SEQ ID NO: 7 dentro del amplicón 1 (A), SEQ ID NO: 5 dentro del amplicón 2 (B), SEQ ID NO: 1 dentro del amplicón 3 (C) SEQ ID NO: 13 dentro del amplicón 4 (D), SEQ ID NO: 4 dentro del amplicón 2 (E) y SEQ ID NO: 14 dentro del amplicón 4 (F).

Descripción detallada de la invención

I. Introducción

La presente invención proporciona métodos para la detección de LOI del IGF2. Los inventores han observado que las combinaciones específicas de los SNP del IGF2, seleccionados a partir de numerosos posibles SNP conocidos y recientemente descubiertos, representan maneras óptimas para detectar la LOI del IGF2 en poblaciones heterogéneas de humanos. La detección de la LOI se basa en la capacidad para detectar ambos alelos del IGF portados por un individuo y por lo tanto requiere que exista al menos una diferencia detectable entre los dos alelos del IGF portados por el individuo. Cualquier SNP del IGF2 en particular por lo tanto es un marcador potencial para medir la LOI, pero es únicamente útil para medir la LOI en individuos que son heterocigotos en ese SNP en particular. En la actualidad, los inventores han identificado un número muy pequeño de SNP del IGF2, que cuando se utiliza en diversas combinaciones o sub-combinaciones, tienen una alta probabilidad de tener al menos uno, y generalmente dos o más SNP que son heterocigotos para cualquier individuo en particular sometido a ensayo. Los estudios pasados habitualmente únicamente tuvieron éxito a la hora de medir el estado de la impronta del IGF2 en el 40-50% de los pacientes sometidos a ensayo. La presente invención, por primera vez, hace posible determinar el estado de la impronta del IGF2 en una proporción elevada de sujetos humanos de diversos antecedentes. Tal como se muestra en los ejemplos, las combinaciones de los SNP descritos en la presente patente pueden ser utilizadas de manera efectiva con una variedad de diferentes antecedentes étnicos y, por tanto, son también efectivos para su uso en la población humana en general (que es una combinación de los diferentes grupos étnicos).

Los siguientes SNP pueden ser detectados en combinaciones, o sub-combinaciones según se describe en la presente patente para lograr una detección óptima de LOI a través de una variedad de grupos étnicos con un mínimo número de marcadores: SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16. Los identificadores de secuencia correspondientes a la secuencia que incluye y circunda el SNP se proporcionan en la Tabla 1, donde la posición polimórfica (y opciones polimórficas) se proporcionan entre corchetes en la secuencia. Cuando un individuo porta una copia del IGF2 con una opción polimórfica, esa copia se denomina “alelo” del SNP.

La presente invención permite la detección de todos los SNP anteriores (por ejemplo, según se representa en las SEQ ID NOs: 1-16, o sub-combinaciones de los mismos). En algunos modos de realización, se detectan los SNP que comprenden o consisten en las SEQ ID NOs: 8, 11, 14 y 16. Por ejemplo, en algunos modos de realización, se detectan los SNP que comprenden o consisten en las SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15 y 16. Tal como se muestra en los Ejemplos a continuación, esta sub-combinación en particular proporciona una tasa muy elecada de heterocigosidad a través de los grupos étnicos y por tanto representa una combinación útil de marcadores para la detección de la LOI. En algunos modos de realización, se detectan los SNP que comprenden o consisten en las SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15 y 16. En algunos modos de realización, se detectan los SNP que comprenden o consisten en las SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15 y 16. En algunos modos de realización, se detectan los SNP que comprenden o consisten en las SEQ ID NOs: 1-16. Los SNPs pueden ser detectados para su genotipado, determinación de LOI, o ambossegún se trata a más adelante.

En algunos modos de realización, el individuo sometido a ensayo es de ascendencia africana (por ejemplo, africano

o afro-americano) y al menos un SNP (por ejemplo,2, 3, 4, 5, 6, 7, o 8)detectado seselecciona de las SEQ ID NOs: 1, 2, 3, 4, 12, 13, 15 y16.En algunosmodos de realización, el individuo sometido a ensayo escaucásicoy al menos un SNP (por ejemplo, 2, 3, 4, 5, 6, o 7) detectado se selecciona de las SEQ ID NOs: 5, 8, 9, 10, 12, 15 y 16. En algunos modos de realización, el individuo sometido a ensayo es mejicano o de ascendencia mejicana y al menos un SNP(porejemplo,2,3,4,5,6,7,8 o9)detectado se selecciona delasSEQ ID NOs: 1, 7, 9, 10, 11, 12,14,15 y

16. En algunos modos de realización, el individuo sometido a ensayo es de ascendencia japonesa (por ejemplo, japonés o japonés-americano) y al menos un SNP (por ejemplo, 2, 3, o 4) detectado se selecciona de las SEQ ID NOs: 10, 12, 14 y 16. En algunos modos de realización, el individuo sometido a ensayo es de ascendencia china (por ejemplo chino-americano) y al menos un SNP (por ejemplo, 2, 3 o 4) detectado se selecciona de las SEQ ID NOs: 6, 8, 12 y16.

La presente invención puede utilizar combinaciones, y usos de las mismas, de polinucleótidos que distinguen entre dos alelos de un primer y un segundo (o más) SNP, según se muestra en las combinaciones presentadas en la presente patente (por ejemplo, según se detalla anteriormente). Por ejemplo, puede utilizarse una combinación de un número diferentes de polinucleótidos, donde cada polinucleótido es capaz de distinguir un diferente SNP. Así, por ejemplo, puede utilizarse al menos un polinucleótido que distinga entre dos o más alelos de cada una de las siguientes combinaciones de SNP. En algunos modos de realización, las combinaciones comprenden 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, o 16 SNP seleccionados del grupo que consiste en SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16.

Por ejemplo, la presente invención puede utilizar combinaciones de polinucleótidos, en donde la combinación comprende diferente polinucleótidos, en donde cada uno de los diferentes polinucleótidos hibridan con un primer alelo de un SNP en particular, pero no hibrida significativamente con el segundo alelo del SNP. “No hibrida significativamente” significa que en presencia de cantidades iguales de ambos alelos en una muestra, el polinucleótido es capaz de detectar la presencia del primer alelo pero no detecta la presencia del segundo alelo, hasta tal punto que interfiere con la interpretación del ensayo. En algunas realizaciones, en presencia de cantidades iguales de ambos alelos en una muestra, el polinucleótido proporciona una señal para una muestra que tiene el primer alelo que es al menos, por ejemplo, aproximadamente 10; 100; 1.000; 10.000; 100.000 veces o más que la señal generada por el polinucleótido para una muestra que tiene una cantidad igual del segundo alelo. “Señal” hace referencia a cualquier resultado indicativo de hibridación del polinucleótido con una secuencia complementaria. En algunosmodos de realización, almenos el 70 %, 80 %, 90 %, 95 % de la secuencia de cualquiera, un subconjunto, o todos los polinucleótidos en el grupo para la detección de las combinaciones de los SNP puede ser complementario a un SNP (o más, dependiendo del número de polinucleótidos) seleccionado de las SEQ ID Nos: 1-16. En algunos modos de realización, los polinucleótidos son, por ejemplo, de 8-200, 8-100, 8-50, 10-50, 115-100, 20-200 de longitud. En algunos modos de realización, los polinucleótidos comprenden, por ejemplo, al menos 8, 10, 15, 20, 30, 40 o 50 nucleótidos complementarios. Una pluralidad de polinucleótidos de detección específica de alelos pueden utilizarse para detectar una pluralidad de diferentes SNP. Por ejemplo, en algunos modos de realización, la pluralidad de polinucleótidos incluye un número suficiente de polinucleótidos para detectar una de las siguientes combinaciones:

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16.

La pluralidad de polinucleótidos puede ser diseñada, por ejemplo, de tal manera que haya un polinucleótido que sea complementario a un alelo de cada uno de los SNP en la combinación. Por consiguiente, un número suficiente de polinucleótidos, tal como al menos un polinucleótido, corresponde a “cada” una de las siguientes regiones de SNP, significa que la pluralidad en suma corresponde a todas las regiones del SNP, no necesariamente que un polinucleótido corresponda a todas las regiones del SNP.

De forma alternativa, cualquiera, un subconjunto, o todos los polinucleótidos pueden distinguir entre dos alelos de un SNP actuando como un cebador en una reacción de extensión de cebadores específica del molde. En estas realizaciones, los polinucleótidos no abarcan generalmente el nucleótido polimórfico, sino que en su lugar hibridan con el ADN o ADNc, de tal manera que se produce la extensión del extremo 3’ del polinucleótido en el nucleótido

polimórfico. Por lo tanto, en algunos modos de realización, el extremo 3’ del polinucleótido es complementario a un nucleótido dentro de 1000, 100, 10, 5, 3, 2 o 1 nucleótido(s) aguas arriba (upstream) del nucleótido polimórfico. En algunas realizaciones, los polinucleótidos son complementarios sobreal menos el 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% o 100% de la longitud de los polinucleótidos de un ADN o ADNc genómico del IGF2 (o un complemento del mismo). En algunas realizaciones, el polinucleótido comprende en su extremo 3’, al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, o más nucleótidos contiguos que son al menos un 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% o 100% complementarios a un ADN o ADNc genómico del IGF2 (o un complemento del mismo) (por ejemplo, NM_000612 (SEQ ID NO: 17) o ENST00000300632 (SEQ ID NO: 18) o ENSG00000167244 (SEQ ID NO: 19)). Opcionalmente, el extremo 5’ del polinucleótido comprenderá una etiqueta de secuencia u otra secuencia no complementaria a un ADN o ADNc del IGF2. Tal como se conoce bien en el arte, se pueden emplear una variedad de métodos de extensión de cebadores para detectar los SNP.

Entre los polinucleótidos de detección específicos de alelos de utilidad para las reacciones de extensión de cebadores se incluyen aquellos que tienen al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos contiguos en el extremo 3’ del polinucleótido de detección específico de alelos, en donde los al menos 8 nucleótidos contiguos son o bien:

100% complementarios a al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos directamente 3’ (o tiene 2 o 3 nucleótidos 3’) de la posición polimórfica de una región del SNP (según se muestra en las SEQ ID Nos: 1-16); o

100%idénticos a al menos 8 (porejemplo, al menos10, 12,15,20) nucleótidos directamente 5’(o tienen 2

o 3 nucleótidos 5’) de la posición polimórfica de la región del SNP [o, por ejemplo, 100% idénticos a al menos 8 (por ejemplo, al menos 10, 12, 15, 20) nucleótidos directamente 3’ (o tiene 2 o 3 nucleótidos 3’) de la posición polimórfica del complemento de la región del SNP].

Esta configuración permite que el extremo 3’ del polinucleótido forme el apareamiento de bases de Watson-Crick con la región justo aguas arriba de la posición polimórfica (a partir de cada cadena), permitiendo que tenga lugar una reacción de extensión de cebadores para determinar qué alelo es un ADNc o un ADN genómico de un individuo. “100% complementario” significa que los nucleótidos contiguos designados (por ejemplo, los “al menos 8”) del polinucleótido son completamente complementarios a las secuencias designadas en la región del SNP, es decir, no existen errores de apareamiento. Se podrá apreciar que los polinucleótidos pueden incluir nucleótidos de origen no natural que mantienen el apareamiento de bases de Watson-Crick. Los polinucleótidos pueden incluir nucleótidos adicionales en el extremo 5’ que o bien son complementarios a la región del SNP o no, según se desee.

Pueden utilizarse combinaciones de polinucleótidos de ese tipo para detectar combinaciones de SNP en particular, según se describe en la presente patente. Por ejemplo, una pluralidad de polinucleótidos de detección específicos de alelos pueden designarse con las característicasanterioresde talmanera queunpolinucleótidopuedecebaruna reacción de extensión separada por lo que la pluralidad detecta una de las siguientes combinaciones:

SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16.

En algunos modos de realización, los polinucleótidos que distinguen entre los dos alelos son al menos 4, 6, 8, 10, 12, 15, 20, 30, 50, o más nucleótidos de longitud. En algunos modos de realización, los polinucleótidos no son más de 1000, 500, 200, 100, 80, 50, 40, 30, o 25 nucleótidos de longitud.Por ejemplo, los polinucleótidos pueden ser, por ejemplo, de 8-25, 8-30, 8-50, 8-100, 10-25, 10-50, 10-100 nucleótidos, etc. Los polinucleótidos que distinguen entre los dos alelos incluirán habitualmente un nucleótido que corresponda con (es decir, que se alinea con) y sea complementario a uno de los nucleótidos polimórficos del SNP. En algunas realizaciones, el último o penúltimo nucleótido 3’ del polinucleótido es complementario a un nucleótido en la posición polimórfica del SNP. Dichas realizaciones pueden ser particularmente útiles en métodos de detección de SNP que emplean los polinucleótidos como cebadores o sondas, por ejemplo en ensayos basados en amplificación tales como los que implican la reacción en cadena de la polimerasa.

Los polinucleótidos pueden marcarse de forma que puedan detectarse. Losmarcadores detectables adecuados para su uso en la presente invención incluyen cualquier composición detectable por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos, eléctricos, ópticos o químicos. Los marcadores de utilidad en la presente invención incluyen biotina para tinción con conjugado de estreptavidina marcado, perlas magnéticas (por ejemplo, Dynabeads™), colorantes fluorescentes (por ejemplo, fluoresceína, rojo Texas, rodamina, proteína verde fluorescente, y similares, ver, por ejemplo, Sondas Moleculares, Eugene, Oregón, Estados Unidos), radio marcadores (por ejemplo, 3H, 125I, 35S, 14C o 32P), enzimas (por ejemplo, peroxidasa de rábano, fosfatasa alcalina y otras utilizadas habitualmente en un ensayo ELISA), y marcadores colorimétricos tales como oro coloidal (por ejemplo, las partículas de oro en un rango de tamaño de diámetro de 40-80 nm dispersan la luz verde con elevada eficacia) o perlas de vidrio coloreado o plástico (por ejemplo, poliestireno, polipropileno, látex, etc.). Las patentes que describen el uso de tales marcadores incluyen las Patentes de Estados Unidos Nos. 3.817.837; 3.850.752; 3.939.350; 3.996.345; 4.277.437; 4.275.149; y 4.366.241. En los casos en que dos o más alelos y/o múltiples SNP o polinucleótidos vayan a ser detectados, puede resultar de utilidad que cada polinucleótido esté marcado con un marcador fluorescente diferente o un marcador de otro tipo. De manera opcional, cuando se utiliza la extensión de cebadores,losnucleótidoslibres pueden sermarcadosdeforma detectable,yopcionalmentedemanera diferencial, permitiendo de ese modo detectar la incorporación de un nucleótido en particular.

Las condiciones de reacción de hibridación pueden variar dependiendo del ensayo que se utilice para detectar los SNP. Se conocen bien en el arte las condiciones de hibridación rigurosas específicas de secuencia, bajo las que un oligonucleótido hibridará solamente con la secuencia diana exactamente complementaria. Las condiciones rigurosas dependen de la secuencia y serán diferentes en diferentes circunstancias. En algunos modos de realización, se seleccionan condiciones rigurosas que son aproximadamente 5 ºC más bajas que el punto de fusión térmico (Tm) para la secuencia específica a una fuerza iónica y pH determinados. La Tm es la temperatura (bajo una fuerza iónica y un pH determinados) a la que el 50 % de los pares de bases se han disociado. La suavización de la rigurosidad de las condicionesdehibridación permitirá quese tolerenerrores deapareamientode secuencias;el gradodeerror de apareamiento tolerado puede ser controlado mediante un ajuste adecuado de las condiciones de hibridación.

Para hibridación de tipo Southern, las condiciones a modo de ejemplo son: formamida al 50%, 5X SSC y SDS al 1%, incubando a 42 ºC o 5X SSC, SDS al 1%, incubando a 65 ºC, con lavado en 0,2X SSC y SDS al 0,1% a 55 ºC, 60 ºC o 65 ºC. Dichos lavados pueden realizarse durante 5, 15, 30, 60, 120 o más minutos. Para aplicaciones de PCR (que impliquen hibridación y/o extensión de cebadores y/o sondas), las condiciones de hibridación que comprenden una condición de apareamiento y extensión son bien conocidas, por ejemplo, según se describe en PCR Protocols: A Guide to Methods and Applications (Innis et al., eds.,1990).

La presente invención se basa en técnicas rutinarias en el campo de la genética recombinante. Los textos básicos que revelan los métodos generales de uso en la presente invención incluyen Sambrook et al., Molecular Cloning, A Laboratory Manual (3ª ed. 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); y Current Protocols in Molecular Biology (Ausubel et al., eds., 1994)).

III. Métodos para medir la pérdida de impronta y la predisposición al cáncer

La detección de la LOI se basa en una comparación de la cantidad de la expresión obtenida a partir de cada una de las dos copias del gen IGF2 dentro de una muestra biológica de un individuo. Por lo tanto, si un individuo tiene dos alelos diferentes del gen IGF2, entonces puede utilizarse detección específica de alelo para cuantificar la expresión de cada copia del gen. Si está funcionando la impronta, entonces una copia del gen (habitualmente la copia materna), no se expresará a pesar de la presencia de una copia genómica del gen. Sin embargo, si se ha producido la LOI, entonces tendrá lugar la expresión a partir de las copias tanto materna como paterna del gen IGF2. Por consiguiente, resulta de utilidad generar una relación de la cantidad de ARN que tiene cada alelo o, de otro modo, determinar sus cantidades relativas. Debido a que los niveles de expresión no siempre son exactamente iguales cuando se ha producido una LOI, en algunos modos de realización se determina que una muestra presenta LOI del IGF2 si la proporción cuantificada del alelo menos abundante es mayor que o igual a un 33,3% de la proporción cuantificada del alelo más abundante en individuos heterocigotos (es decir, una relación 3:1 del alelo expresado más abundantemente con respecto al alelo expresado menos abundantemente). La expresión del alelo menos abundante a un nivel inferior al 33,3% de las partes cuantificadas del alelo más abundante, pueden también indicar pérdida de impronta del gen IGF2 y puede estar asociada con un aumento del riesgo de cáncer. Por lo tanto, en algunos modos de realización, se determina que una muestra presenta LOI del IGF2 si la proporción cuantificada del alelo menos abundante es mayor que o igual a por ejemplo un 10%, 15%, 20%, 25% o 30% de la proporción cuantificada del alelo más abundante en los individuos heterocigotos (es decir, una relación del alelo expresado más abundantemente con respecto al alelo expresado menos abundantemente de 10.00:1, 6.67:1, 5.00:1, 4.00:1 o 3.33:1, respectivamente). En algunas realizaciones, se determina que una muestra presenta LOI del IGF2 si la proporción cuantificada del alelo menos abundante es mayor que o igual a, por ejemplo, una relación de 10:1, 9:1, 8:1, 7:1, 6:1, 5:1, o 4:1 con respecto al alelo más abundante en individuos heterocigotos (es decir, 10%, 11,11%, 12,50%, 14,29% o 16,67%, 20,00%, o 25,00% de la proporción cuantificada del alelo más abundante, respectivamente).

Resulta generalmente deseable conocer si un individuo es heterocigoto para un SNP particular. Por lo tanto, en algunas realizaciones, se obtiene tanto ADN (es decir, ADN genómico) como ARN de una muestra. El ADN genómico se somete a ensayo para determinar si el individuo es heterocigoto para un SNP en particular. Si el individuo esheterocigoto parauno omásSNPde lacombinacióndeSNP genotipados,entoncesesposible medir la pérdida de impronta detectando el ARN que tenga cualquiera de los dos o más posibles alelos de SNP seleccionados de los SNP heterocigotos, y a continuación comparando su expresión. Esto se encuentra ilustrado en la Figura 2.En algunosmodos de realización,sedetectaelgenotipo de una combinación de SNPsegúnse muestra en la presente patente, y a continuación se determina la LOI para uno o más de los SNP que se han determinado que son heterocigotos.

En algunas circunstancias, sin embargo, puede ser beneficioso detectar solamente ARN sin conocer previamente si el individuo es un heterocigoto para un SNP en particular. En esta circunstancia, observar cantidades relativamente similares de la expresión de dos alelos indica LOI, mientras que detectar la expresión de un alelo no es informativo, ya que no se sabrá si el resultado negativo es debido a impronta o a homocigosidad del SNP en particular. Sin embargo, aumentando el número de SNP diferentes detectados, es posible diseñar un ensayo de tal manera que la probabilidad de que un individuo sea homocigoto para cada SNP fuera baja. Tal como se explica en la presente patente, las combinaciones de SNP proporcionadas hacen improbable que un individuo en particularsea homocigoto para cada SNP en la combinación. Más aún, debido a que la impronta por lo general, no es totalmente completa, es posible determinar el genotipo de un individuo midiendo la cantidad de ARN solo, si se utiliza un ensayo lo suficientemente sensible de tal manera que se pueda distinguir entre un alelo impreso (que aún generará una cantidad extremadamente pequeña de transcrito, lo que indica por tanto un heterocigoto), y un homocigoto (que no realiza ningún transcrito para un segundo alelo).

En algunos modos de realización, puede seleccionarse un conjunto de SNP para permitir la mayor probabilidad de realizar ensayos con respecto a un SNP heterocigoto independientemente de la raza. Por tanto, en algunos modos de realización, se utiliza un panel de SNPseleccionados a partir de la Tabla 5.

IV. Métodos de detección de SNP

Las técnicas de detección para evaluar ácidos nucleicos con respecto a la presencia de un SNP, implican procedimientos bien conocidos en el campo de la genética molecular. Además, muchos de los métodos implican la amplificación de ácidos nucleicos. Se proporcionan en el arte amplias directrices para realizar la detección de un SNP. Los ejemplos de referencias incluyen manuales tales como PCR Technology: Principles and Applications for DNA Amplification (ed. H. A. Erlich, Freeman Press, NY, N.Y., 1992); PCR Protocols: A Guide to Methods and Applications (eds. Innis, et al., Academic Press, San Diego, Calif., 1990); Current Protocols in Molecular Biology, Ausubel, 1994-1999, incluyendo actualizaciones complementarias hasta abril de 2004; Sambrook & Russell, Molecular Cloning, A Laboratory Manual (3ª Ed, 2001).

Aunque los métodos habitualmente emplean etapas de PCR, también pueden utilizarse otros protocolos basados en amplificación o no basados en amplificación. Los métodos de amplificación adecuados incluyen reacción en cadena de la ligasa (ver, por ejemplo, Wu & Wallace, Genomics 4:560-569, 1988); ensayo de desplazamiento de cadena (ver, por ejemplo, Walker et al., Proc. Natl. Acad. Sci. USA 89:392-396, 1992; Patente de Estados Unidos Nº 5.455.166); y diversos sistemas de amplificación basados en transcripción, incluyendo los métodos descritos en las Patentes de Estados Unidos Nos.: 5.437.990; 5.409.818 y 5.399.491; el sistema de amplificación de la transcripción (TAS) (Kwoh et al., Proc. Natl. Acad. Sci. USA 86:1173-1177, 1989); y replicación de secuencia auto-sostenida (3SR) (Guatelli et al., Proc. Natl. Acad. Sci. USA 87:1874-1878, 1990; WO 92/08800). De manera alternativa, pueden utilizarse métodos que amplifican la sonda a niveles detectables, tales como la amplificación por Qβreplicasa (Kramer & Lizardi, Nature 339: 401-402, 1989; Lomeli et al., Clin. Chem. 35: 1826-1831, 1989). Un análisis de los métodos de amplificación conocidos se proporciona, por ejemplo, por Abramson y Myers en Current Opinion in Biotechnology 4:41-47, 1993.

Habitualmente, la detección de un SNP en un individuo se realiza utilizando cebadores y/o sondas de oligonucleótidos. Los oligonucleótidos pueden prepararse mediante cualquier método adecuado, habitualmente síntesis química. Los oligonucleótidos pueden sintetizarse utilizando reactivos e instrumentos disponibles comercialmente. De manera alternativa, pueden adquirirse a través de fuentes comerciales. Los métodos para sintetizar oligonucleótidos se conocen bien en el arte (ver, por ejemplo, Narang et al., Meth. Enzymol. 68:90-99, 1979; Brown et al., Meth. Enzymol. 68:109-151, 1979; Beaucage et al., Tetrahedron Lett. 22: 1859-1862, 1981; y el método de soporte sólido de la Patente de Estados Nº 4.458.066). Además, pueden utilizarse modificaciones de los métodos anteriormente descritos de síntesis para producir un impacto deseado en el comportamiento enzimático con respecto a los oligonucleótidos sintetizados. Por ejemplo, la incorporación de enlaces fosfodiéster modificados (por ejemplo, fosforotioato, metilfosfonatos, fosfoamidato o boranofosfato) o enlaces distintos a un derivado del ácido fosforoso en un oligonucleótido pueden utilizarse para evitar la escisión en un sitio seleccionado. Además, el uso de azúcares modificados en 2’-amino tiende a favorecer el desplazamiento sobre la digestión del oligonucleótido cuando se hibrida con un ácido nucleico que también es el molde para la síntesis de una nueva cadena de ácido nucleico.

La cantidad y/o presencia de un alelo de un SNP en una muestra de un individuo puede determinarse utilizando muchos métodos de detección que son bien conocidos en el arte. Una cantidad de formatos de ensayo de SNP suponen uno de diversos protocolos generales: hibridación utilizando oligonucleótidos específicos de alelo, extensión de cebadores, ligamiento específico de alelo, secuenciación, o técnicas de separación electroforética, por ejemplo, polimorfismo conformacional monocatenario (SSCP) y análisis de heterodúplex. Entre los ejemplos de ensayosse incluyen ensayos de nucleasa 5’,incorporación de un terminadormarcado con colorante dirigida porun molde, ensayos de oligonucleótidos específicos de alelo de baliza molecular, ensayos de extensión de bases únicas y puntuación de SNP por secuencias de pirofosfato en tiempo real. Pueden realizarse análisis de secuencias amplificadas utilizando diversas tecnologías tales como microchips, ensayos de polarización de fluorescencia y espectrometría de masas de desorción e ionización porláser asistidapormatriz(MALDI). Dos métodos que también pueden utilizarse son ensayos basados en la escisión invasiva con nucleasas Flap y metodologías que emplean sondas tipo candado (padlock).

La determinación de la presencia o ausencia de un alelo de SNP en particular generalmente se lleva a cabo analizando una muestra de ácido nucleico que se obtiene de una muestra biológica del individuo que se va a analizar. Aunque la cantidad y/o presencia de un alelo de SNP puede medirse directamente utilizando ARN de la muestra, con frecuencia el ARN en una muestra se someterá a transcripción inversa, opcionalmente se amplificará, y a continuación el alelo de SNPse detectará en el ADNc resultante.

Se describen brevemente metodologías utilizadas frecuentemente para el análisis de muestras de ácido nucleico para medir la cantidad y/o presencia de un alelo de un SNP. Sin embargo, puede utilizarse en la invención cualquier método conocido en el arte para medir la cantidad y/o presencia de polimorfismos de un único nucleótido.

Hibridación específica de alelo

Esta técnica, también denominada comúnmente hibridación con oligonucleótidos específicos de alelo (ASO) (por ejemplo, Stoneking et al., Am. J. Hum. Genet. 48:70-382, 1991; Saiki et al., Nature 324, 163-166, 1986; EP 235.726; y WO 89/11548), se basa en distinguir entre dos moléculas de ADN que difieren en una base hibridando una sonda de oligonucleótidos que es específica de una para las variantes con un producto amplificado obtenido a partir de la amplificación de la muestra de ácido nucleico. En algunos modos de realización, este método emplea oligonucleótidos cortos, por ejemplo, de 15-20 bases de longitud. Las sondas están diseñadas para hibridar diferencialmente con una variante frente a otra. Se encuentran disponibles en el arte principios y directrices para diseñar una sonda de ese tipo, por ejemplo, en las referencias citadas en el presente documento. Las condiciones de hibridación deberían ser suficientemente rigurosas para que haya una diferencia significativa en la intensidad de hibridación entre alelos, y preferiblemente una respuesta esencialmente binaria, por lo que una sonda hibrida con únicamente uno de los alelos. Algunas sondas se diseñan para hibridar con un segmento de ADN o ADNc diana de tal manera que el sitio polimórfico se alinee con una posición central (por ejemplo, dentro de una distancia de 4 bases del centro del oligonucleótido, por ejemplo, en un oligonucleótido de 15 bases en la posición 7; en un oligonucleótido de 16 bases en la posición 8 o 9) de la sonda (por ejemplo, un polinucleótido de la invención distingue entre dos alelos de SNPsegún se expone en la presentepatente), pero este diseño no es necesario.

La cantidad y/o presencia de un alelo se determina midiendo la cantidad de oligonucleótido específico de alelo que se hibrida con la sonda. Habitualmente, el oligonucleótido se marca con un marcador tal como un marcador fluorescente. Por ejemplo, un oligonucleótido específico de alelo se aplica a oligonucleótidos inmovilizados que representan secuencias de SNP potenciales. Después de condiciones de hibridación y lavado rigurosas, se mide la intensidad de la fluorescencia para cada oligonucleótido del SNP.

En un modo de realización, el oligonucleótido presente en el sitio polimórfico se identifica por la hibridación, bajo condiciones de hibridación específicas de secuencia, con una sonda de oligonucleótidos exactamente complementaria a uno de los alelos polimórficos en una región que abarca el sitio polimórfico. La secuencia que hibrida con la sonda y las condiciones de hibridación específica de secuencia se seleccionan de manera que un único error de apareamiento en elsitio polimórfico desestabiliza la cadena doble de hibridación lo suficiente para que efectivamente no se forme. Por tanto, bajo condiciones de hibridación específicas de la secuencia, se formarán cadenas dobles estables únicamente entre la sonda y la secuencia alélica exactamente complementaria. Por tanto, se encuentran dentro del alcance de la invención los oligonucleótidos de aproximadamente 10 a aproximadamente 35 nucleótidos de longitud, por ejemplo de aproximadamente 15 a aproximadamente 35 nucleótidos de longitud, que sean exactamente complementarios a una secuencia de alelo en una región que abarca el sitio polimórfico (por ejemplo, una de las SEQ ID Nos: 1-16).

En un modo de realización alternativo, la cantidad y/o presencia del nucleótido en el sitio polimórfico puede identificarse mediante hibridación bajo condiciones de hibridación suficientemente rigurosas con un oligonucleótido sustancialmente complementario a uno de los alelos del SNP en una región que abarca el sitio polimórfico, y exactamente complementario al alelo en el sitio polimórfico. Debido a que los errores de apareamiento que tienen lugar en sitios no polimórficos son errores de apareamiento con ambas secuencias de alelos, la diferencia en el número de errores de apareamiento en una doble cadena formada con la secuencia del alelo diana, y en una doble cadena formada con la correspondiente secuencia del alelo no diana es la misma que cuando se utiliza un oligonucleótido exactamente complementario a la secuencia del alelo diana. En esta realización, las condiciones de hibridación se encuentran lo suficientemente suavizadas para permitir la formación de dobles cadenas estables con la secuencia diana, a la vez que se mantiene la suficiente rigurosidad para impedir la formación de dobles cadenas estables con las secuencias no diana. En condiciones de hibridación suficientemente rigurosas, se formarán dobles cadenas estables únicamente entre la sonda y el alelo diana. Por tanto, se encuentran dentro del alcance de la invención los oligonucleótidos de aproximadamente 10 a aproximadamente 35 nucleótidos de longitud, preferiblemente de aproximadamente 15 a aproximadamente 35 nucleótidos de longitud, que son sustancialmente complementarios a una secuencia de alelo en una región que abarca el sitio polimórfico, y que son exactamente complementarios a la secuencia de alelo en el sitio polimórfico.

El uso de oligonucleótidos sustancialmente, más que exactamente, complementarios puede ser deseable en formatos de ensayo en los que la optimización de las condiciones de hibridación es limitada. Por ejemplo, en un formato habitual de ensayo de inmovilización de sondas multi-diana, se inmovilizan las sondas para cada diana en un únicosoporte sólido. Se llevan a cabo hibridaciones simultáneamente poniendo en contacto el soporte sólido con una solución que contiene el ADN o ADNc diana. Debido a que todas las hibridaciones se llevan a cabo en condiciones idénticas, las condiciones de hibridación no pueden ser optimizadas por separado para cada sonda. La incorporación de errores de apareamiento en una sonda puede utilizarse para ajustar la estabilidad de doble cadena cuando el formato de ensayo impide ajustar las condiciones de hibridación. Es bien conocido el efecto de un error de apareamiento en particular introducido en la estabilidad de la doble cadena, y la estabilidad de la doble cadena puede tanto calcularse como determinarse empíricamente de forma rutinaria, tal como se ha descrito anteriormente. Las condiciones de hibridación adecuadas, que dependen del tamaño y la secuencia exactos de la sonda, pueden seleccionarse de forma empírica utilizando las directrices proporcionadas en la presente patente y que son bien conocidas en el arte. El uso de sondas de oligonucleótidos para detectar diferencias de un único par de bases en la secuencia se describe, por ejemplo, en Corner et al., 1983, Proc.Natl. Acad. Sci. USA 80:278-282, yen las Patentes de Estados Unidos Nos.5.468.613 y 5.604.099.

El cambio proporcional en la estabilidad entre una hibridación de doble cadena perfectamente coincidente y una hibridación con un error de apareamiento de una única base depende de la longitud de los oligonucleótidos hibridados.Lasdoblescadenas formadas con secuenciasdesondamáscortasse desestabilizanproporcionalmente más por la presencia de un error de apareamiento. En la práctica, se prefieren oligonucleótidos entre aproximadamente 15 y aproximadamente 35 nucleótidos de longitud para la detección específica de la secuencia. Además, debido a que los extremos de un oligonucleótido hibridado experimentan una disociación aleatoria continua y una re-hibridación debido a la energía térmica, un error de apareamiento en cualquiera de los extremos desestabiliza la doble cadena de hibridación menos que un error de apareamiento que ocurra de forma interna. Preferiblemente,paraladiferenciacióndeuncambio de un único parde bases en la secuenciadiana, se selecciona la secuencia de la sonda que hibrida con la secuencia diana, de tal manera que el sitio polimórfico tiene lugar en la región interna de la sonda.

Los criteriosanteriorespara seleccionaruna secuenciadelasonda que hibridacon un SNPenparticular se aplican a la región de hibridación de la sonda, es decir, a la parte de la sonda que está implicada en la hibridación con la secuencia diana. Una sonda puede estarunida a una secuencia de ácido nucleico adicional, tal como una cola poli-T utilizada para inmovilizar la sonda, sin alterar significativamente las características de hibridación de la sonda. Un experto en arte reconocerá que para su uso en los presentes métodos, una sonda unida a una secuencia de ácido nucleico adicional que no es complementaria a la secuencia diana y, por lo tanto, no está implicada en la hibridación, es esencialmente equivalente a la sonda no unida.

Se conocen en el arte formatos de ensayo adecuados para detectar híbridos formados entre sondas ysecuencias de ácido nucleico diana en una muestra conocida en el arte e incluyen el formato de diana inmovilizada (dot-blot) y los formatos de ensayo de sonda inmovilizada (dot-blot inverso o blot de línea inversa). Los formatos de ensayo de dotblot y dot-blot inverso se describen en las Patentes de Estados Unidos Nos. 5.310.893; 5.451.512; 5.468.613; y

5.604.099.

En un formato de dot-blot, el ADN o ADNc diana amplificado se inmoviliza en un soporte sólido, tal como una membrana de nailon. El complejo de membrana-diana se incuba con una sonda marcada bajo condiciones de hibridación adecuadas, la sonda no hibridada se retira mediante lavado bajo condiciones adecuadamente rigurosas, y la membrana se monitoriza para determinar la presencia de la sonda unida.

En el formato de dot-blot (o blot de línea) inverso, las sondas se inmovilizan en un soporte sólido, tal como una membrana de nailon o una placa de microtitulación. El ADN o ADNc diana se marca, habitualmente durante la amplificación mediante la incorporación de cebadores marcados. Uno o ambos de los cebadores pueden marcarse. El complejo de membrana-sonda se incuba con el ADN o ADNc diana amplificado marcado bajo condiciones de hibridación adecuadas, el ADN o ADNc diana no hibridado se retira mediante lavado bajo condiciones de hibridación rigurosas y la membrana se monitoriza para determinarla presencia del ADN o ADNc diana unido.

Una sonda específica de alelo que es específica para una de las variantes de polimorfismo es utilizada con frecuencia junto con la sonda específica de alelo para la otra variante de polimorfismo. En algunas realizaciones, las sondas se inmovilizan en un soporte sólido yla secuencia diana en un individuo seanaliza utilizandoambas sondas simultáneamente. Ejemplos de matrices de ácido nucleico se describen en el documento WO 95/11995. Puede utilizarse la mismamatrizo una matrizdiferente para elanálisisde polimorfismoscaracterizados.El documento WO 95/11995 también describe sub-matrices que son optimizadas para la detección de formas variantes de un polimorfismo caracterizado previamente.

Cebadores específicos de alelo

La cantidad y/o presencia de un alelo también se detecta comúnmente utilizando amplificación específica de alelo o métodos de extensión de cebadores. Estas reacciones implican, habitualmente, el uso de cebadores que están diseñados para establecer como diana específicamente un polimorfismo, mediante un error de apareamiento en el extremo 3’ de un cebador. La presencia de un error de apareamiento afecta a la capacidad de una polimerasa para extender un cebador cuando la polimerasa carece de actividad correctora de errores. Por ejemplo, para detectar una secuencia de alelo utilizando un método basado en amplificación o extensión específica de alelo, se diseña un cebador complementario al nucleótido polimórfico de un SNP, de manera que el nucleótido 3’ hibride en la posición polimórfica. La presencia del alelo en particular puede ser determinada por la capacidad del cebador para iniciar la extensión. Si el terminal 3’ presenta un error de apareamiento, se impide la extensión. Si un cebador coincide con el nucleótido polimórfico en el extremo 3’, el cebadorse extenderá de forma eficaz.

Habitualmente, el cebador se utiliza junto con un segundo cebador en una reacción de amplificación. El segundo cebador hibrida en un sitio no relacionado con la posición polimórfica. La amplificación se desarrolla a partir de los dos cebadores que conducen a un producto detectable, lo que indica que la forma alélica en particular está presente. Métodos basados en extensión y amplificación específicos de alelos se describen en, por ejemplo, el documento WO 93/22456; las Patentes de Estados Unidos Nos. 5.137.806; 5.595.890; 5.639.611; y la Patente de Estados Unidos Nº

4.851.331.

Utilizando métodos basados en amplificación específica de alelos, la identificación y/o cuantificación de los alelos requieren la detección de la presencia o ausencia de las secuencias diana amplificadas. Se conocen bien en el arte métodos para la detección de secuencias diana amplificadas. Por ejemplo, la electroforesis en gel y los ensayos de hibridación de sondas descritos se utilizan con frecuencia para detectar la presencia de ácidos nucleicos.

En un método alternativo sin sonda, el ácido nucleico amplificado se detecta monitorizando el aumento en la cantidad total de ADN bicatenario en la mezcla de reacción; se describe, por ejemplo, en la Patente de Estados Unidos Nº 5.994.056; y en las Publicaciones de Patente Europea Nos. 487.218 y 512.334. La detección de ADN o ADNcdiana bicatenario se basa en elaumento de la fluorescenciaque muestran diversos colorantesqueseunen al ADN, por ejemplo, Verde SYBR, cuando se unen a ADN bicatenario.

Como se puede apreciar por parte de un experto en el arte, pueden realizarse métodos de amplificación específica de alelos en reacciones que emplean múltiples cebadores específicos de alelos para establecer como diana alelos en particular. Los cebadores para dichas aplicaciones multiplex están generalmente marcados con marcadores distinguibles, o se seleccionan de manera que los productos de amplificación producidos a partir de los alelos sean distinguibles por tamaño. Por tanto, por ejemplo, ambos alelos en una única muestra pueden identificarse y/o cuantificarse utilizando una única amplificaciónmediante diversos métodos.

Como en el caso de sondas específicas de alelos, un cebador de oligonucleótidos específico de alelos puede ser exactamente complementario a uno de los alelos polimórficos en la región de hibridación, o puede tener algunos errores de apareamiento en posiciones distintas del terminal 3’ del oligonucleótido, ocurriendo dichos errores de apareamiento en sitios no polimórficos en ambassecuencias del alelo.

Ensayo de nucleasa 5’

La cantidad y/o presencia de un alelo también puede determinarse utilizando un ensayo “TaqMan®” o “ensayo de nucleasa 5’”, tal como se describe en las Patentes de Estados Unidos Nos. 5.210.015; 5.487.972; y 5.804.375; y Holland et al. 1988, Proc. Natl. Acad. Sci. USA 88:7276-7280. En el ensayo de TaqMan®, se añaden sondas de detección marcadas que hibridan dentro de la región amplificada durante la reacción de amplificación. Las sondas se modifican para evitar que las sondas actúen como cebadores para la síntesis de ADN. La amplificación se realiza utilizando una ADN polimerasa que tiene actividad exonucleasa 5’ a 3’. Durante cada etapa de síntesis de la amplificación, cualquiersonda que hibride con el ácido nucleico diana aguas abajo(downstream)del cebador que se está extendiendo, se degrada por la actividad exonucleasa 5’ a 3’ de la ADN polimerasa. Por tanto, la síntesis de una nueva cadena diana también da como resultado la degradación de una sonda, y la acumulación del producto de degradación proporciona una medida de la síntesis de las secuencias diana.

La sonda de hibridación puede ser una sonda específica de alelo que diferencia entre los alelos del SNP. De forma alternativa, el método puede ser realizado utilizando un cebador específico de alelo y una sonda marcada que se una con un producto amplificado.

Puede utilizarse cualquiermétodo adecuado para detectarun producto de degradación en un ensayo de nucleasa 5’. Con frecuencia, la sonda de detección se marca con dos colorantes fluorescentes, uno de los cuales es capaz de extinguir la fluorescencia del otro colorante. Los colorantes se unen a la sonda, preferiblemente uno se une al terminal5’ yel otro se une a un sitio interno,de tal manera que la extinción tiene lugarcuando la sonda está en un estado no hibridado, y de tal manera que la escisión de la sonda mediante la actividad de la exonucleasa 5’ a 3’ de laADNpolimerasa ocurreentrelos dos colorantes.La amplificación da como resultadolaescisióndela sonda entre los colorantes con una eliminación conjunta de la extinción y un aumento de la fluorescencia observable a partir del colorante extinguido inicialmente. La acumulación del producto de degradación se controla midiendo el aumento de la fluorescencia en la reacción. Las Patentes de Estados Unidos Nos. 5.491.063 y 5.571.673 describen métodos alternativos para detectar la degradación de la sonda que ocurre junto con la amplificación.

Secuenciación de ADN y extensiones de cebadores de una única base o de otro tipo

La cantidad y/o presencia de un alelo también puede determinarse mediante secuenciación directa. Los métodos incluyen, por ejemplo, métodos basados en secuenciación de didesoxi y otros métodos tales como la secuencia de Maxam y Gilbert (ver, por ejemplo, Sambrook y Russell, mencionado anteriormente).

Otros métodos de detección incluyen Pirosecuenciación (Pyrosequencing™) de productos de longitud de oligonucleótidos. Dichos métodos emplean con frecuencia técnicas de amplificación tales como la PCR. Por ejemplo, en la pirosecuenciación, un cebador de secuenciación se hibrida con un molde de ADN o ADNc amplificado por PCR, monocatenario; y se incuba con las enzimas, ADN polimerasa, ATP sulfurilasa, luciferasa y apirasa, y los sustratos, adenosin-5’-fosfosulfato (APS) y luciferina. El primero de cuatro desoxinucleótidos trifosfatos (dNTP) se añade a la reacción. La ADN polimerasa cataliza la incorporación del desoxinucleótido trifosfato en la cadena de ADN, si es complementario a la base en la cadena molde. Cada evento de incorporación se acompaña de la liberación de pirofosfato (PPi) en una cantidad equimolar a la cantidad de nucleótido incorporado. La ATP sulfurilasa convierte cuantitativamente el PPi en ATP en presencia de adenosin-5’-fosfosulfato. Este ATP activa la conversión mediada por luciferasa de la luciferina en oxiluciferina, que genera luz visible en cantidades que son proporcionales a la cantidad de ATP. La luz producida en la reacción catalizada por la luciferasa se detecta mediante una cámara de dispositivo acoplado a carga (CCD) y se ve como un pico en un pirograma™.Cada señal de luzes proporcional a la cantidad de nucleótidos incorporados. La apirasa, una enzima degradante de nucleótidos, degrada continuamente los dNTP no incorporados yel ATP en exceso.Cuando la degradación se completa, se añade otro dNTP.

Otro método similar para caracterizar SNP no requiere el uso de una PCR completa, sino que habitualmente utiliza únicamente la extensión de un cebador mediante un único nucleótido, que es complementario a cualquiera de las opciones alélicas del SNP, y en algunos casos que está modificado para ser fácilmente detectado. Las modificaciones de los ddNTP pueden incluir, pero no se limitan a, marcaje con fluorescencia o modificación de la masa. El nucleótido incorporado en el sitio polimórfico puede ser identificado entonces mediante la detección de un cebadorque ha sido extendidomedianteunabase yestá marcado con fluorescencia o modificado en su masa (por ejemplo, Kobayashi et al. Mol. Cell. Probes, 9:175-182, 1995). Por supuesto los productos de extensión también pueden detectarse en base a otros tipos de marcadores, o por espectrometría de masas, según se desee.

En un método similar, el ADN diana amplificado por PCR o el ADNc diana amplificado por RT-PCR puede ser utilizado como unmolde para una reacción de extensión de cebadordeun único nucleótido porla que se incorpora un único ddNTP marcado con fluorescencia, complementario al nucleótido polimórfico en el extremo 3’ de un único cebador. Cada ddNTP específico puede marcarse con un colorante fluorescente diferente (por ejemplo, ddATP marcado con dR6G, ddCTP marcado con dTAMRA™, ddGTP marcado con dR110 y ddTTP o ddUTP marcado con dROX™). Por lo tanto, la extensión de un único nucleótido del cebador no marcado inicialmente, marca el cebador con un colorante fluorescente específico que identifica la base que se añadió al extremo 3’ del cebador no marcado. Los cebadores extendidos pueden resolverse y analizarse para determinar la presencia y cantidad relativa de cada cebador específico marcado con colorante, que representa las cantidades relativas de cada alelo en el molde de ADN diana o ADNc diana.

Análisis de polimorfismo de longitud de fragmentos de restricción

En otras realizaciones, la cantidad y/o presencia de un alelo de un SNP puede determinarse por digestión diferencial del ADN o ADNc diana amplificado cuando el nucleótido polimórfico de interés queda dentro de la secuencia de reconocimiento de una enzima de restricción. En un caso, un alelo del SNP (el primer alelo) mantiene la secuencia de reconocimiento de la enzima de restricción y el otro alelo (el segundo alelo) no. En este caso, la enzima de restricción escindirá el ADN o ADNc diana que incluye el primer alelo, pero no el ADN o ADNc diana que incluye el segundo alelo. En otro caso, un alelo (el primer alelo) del SNP mantiene la secuencia de reconocimiento de una enzima de restricción (la primera enzima de restricción) y el otro alelo (el segundo alelo) mantiene la secuencia de reconocimiento de una enzima de restricción diferente (la segunda enzima de restricción). En este caso, la primera enzima de restricción escindirá el ADN o ADNc diana que incluye el primer alelo, pero no el ADN o ADNc diana que incluye el segundo alelo. La segunda enzima de restricción escindirá el ADN o ADNc diana que incluye el segundo alelo, pero no el ADN o ADNc diana que incluye el primer alelo. La cantidad y/o presencia de alelos puede ser determinadamediantediversos métodosque incluyen,perosinlimitarsea,hibridación Southern blotcon fragmentos restringidos inmovilizados y cuantificación de intensidades de bandas, resolución y visualización de fragmentos de restricción mediante electroforesis en gel, resolución y cuantificación de fragmentos de restricción mediante electroforesis capilar (tal como se realiza utilizando un BioAnalizador Agilent), o amplificación por PCR cuantitativa diferencial del ADN o ADNc molde escindido frente a no escindido.

Electroforesis en gel de gradiente desnaturalizante

Los productos de amplificación generados utilizando la reacción en cadena de la polimerasa pueden ser analizados mediante el uso de electroforesis en gel de gradiente desnaturalizante. Pueden identificarse diferentes alelos en base a las diferentes propiedades de fusión dependientes de la secuencia y a la migración electroforética del ADN en solución (ver, por ejemplo, Erlich, ed., PCR Technology, Principles and Applications for DNA Amplification, W. H. Freeman and Co, Nueva York, 1992, Capítulo 7).

Análisis de polimorfismo de conformación monocatenaria

Los alelos de secuencias diana pueden diferenciarse utilizando análisis de polimorfismo de conformación monocatenaria, que identifica diferencias de bases por la alteración en la migración electroforética de los productos monocatenarios de la PCR, según se describe, por ejemplo, en Orita et al., Proc. Nat. Acad. Sci. 86, 2766-2770 (1989). Pueden generarse productos de PCR o RT-PCR amplificados según se ha descrito anteriormente, y se pueden calentar o desnaturalizar de otro modo, para formar productos de amplificación monocatenarios. Los ácidos nucleicos monocatenarios pueden volver a plegarse o formar estructuras secundarias que dependen parcialmente de la secuencia base.Las diferentesmovilidades electroforéticasde los productos de amplificaciónmonocatenarios pueden estar relacionadas con una diferencia de la secuencia base entre alelos de la diana.

Los métodos de detección del SNP con frecuencia emplean oligonucleótidos marcados. Los oligonucleótidos pueden marcarse incorporando un marcador detectable por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos o químicos. Los marcadores útiles incluyen colorantes fluorescentes, marcadores radiactivos, por ejemplo, 32P, reactivos densos en electrones, enzimas, tal como la peroxidasa o la fosfatasa alcalina, biotina, o haptenos y proteínas para los que están disponibles antisueros o anticuerpos monoclonales. Son bien conocidas en el arte las técnicas de marcaje (ver, por ejemplo, Current Protocols in Molecular Biology, mencionado anteriormente; Sambrook & Russell,mencionado anteriormente).

V. Métodos para cuantificar ARN

La presencia y la cantidad de ARN correspondiente a un SNP en particular pueden determinarse fácilmente de acuerdo con cualquier método para cuantificar el ARN. Pueden utilizarse diversos métodos que implican enlace del ARN con un soporte sólido y la hibridación del ARN (por ejemplo, ensayos Northern blot, ensayos dot-blot, etc.).

En algunos modos de realización, el ARN diana se transcribe de forma inversa en primer lugar (por ejemplo, con transcriptasa inversa), y después el ADNc resultante se cuantifica mediante cualquier método conocido en el arte (hibridación blot o de transferencia, RT-PCR, etc.) como un sustituto de la cantidad de ARN. Se conocen y se describen diversos métodos de transcripción inversa, por ejemplo, en Sambrook et al., Molecular Cloning, A Laboratory Manual (3ª ed. 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); y Current Protocols in Molecular Biology (Ausubel et al., eds., 1994)), y pueden implicar una transcripción inversa utilizando cebadores específicos o no específicos.

En algunas realizaciones, se utiliza RT-PCR u otras técnicas de amplificación cuantitativa para cuantificar el ARN diana. Es bien conocida la amplificación del ADNc utilizando reacciones (ver las Patentes de Estados Unidos

4.683.195 y 4.683.202; PCR PROTOCOLS:AGUIDE TO METHODSAND APPLICATIONS (Innis et al., eds, 1990)).

Las secuencias amplificadas por los métodos de la invención pueden adicionalmente ser evaluados, detectados, clonados, secuenciados y similar, bien en solución o bien después de su unión con un soporte sólido, por cualquier método habitualmente aplicado a la detección de una secuencia de ADN específica, tal como PCR, restricción de oligómeros (Saiki, et al., Bio/Technology3:1008-1012 (1985)),análisisde sondas de oligonucleótidos específicas de alelo (ASO) (Conner, et al., PNAS USA 80:278 (1983)), ensayos de ligamiento de oligonucleótidos (OLA) (Landegren, et al., Science 241:1077, (1988)), y similar. Se han revisado técnicas moleculares para el análisis de ADN (Landegren, et al., Science 242:229-237 (1988)).

Se revelan métodos de amplificación cuantitativa, por ejemplo, en las Patentes de Estados Unidos Nos. 6.180.349; 6.033.854; y 5.972.602, además de en, por ejemplo, Gibson et al., Genome Research 6:995-1001 (1996); DeGraves, et al., Biotechniques 34(1):106-10, 112-5 (2003); Deiman B, et al., Mol Biotechnol. 20(2):163-79 (2002). Las amplificaciones pueden ser monitorizadas en “tiempo real”.

En general, la amplificación cuantitativa se basa en la monitorización de la señal (por ejemplo, la fluorescencia de una sonda) que representa las copias del molde en ciclos de una reacción de amplificación (por ejemplo, PCR). En los ciclos iniciales de la PCR, se observa una señal muy baja porque la cantidad del amplicón formado no soporta una salida de la señal medible del ensayo. Después de los ciclos iniciales, a medida que aumenta la cantidad de amplicón formado, la intensidad de señal aumenta hasta un nivel medible y alcanza una meseta en ciclos posteriores cuandola PCRentra en una fase no logarítmica.Mediante un gráficodela intensidad de señalfrente al número de ciclos, puede deducirse el ciclo específico en el que se obtiene una señal medible de la reacción de la PCR, y utilizarse para calcular a partir de ahí la cantidad de la diana antes del inicio de la PCR. El número de los ciclos específicos que se determina por este método se denomina habitualmente el umbral del ciclo (Ct). Ejemplos de métodos se describen, por ejemplo, en Heid et al. Genome Methods 6:986-94 (1996) en referencia a sondas de hidrólisis.

Un método para la detección de productos de amplificación es el ensayo de PCR con “hidrólisis” por exonucleasa 5’3’ (también denominado ensayo TaqMan™) (Patentes de Estados Unidos Nos. 5.210.015 y 5.487.972; Holland et al., PNAS USA 88:7276-7280 (1991); Lee et al., Nucleic Acids Res. 21:3761-3766 (1993)). Este ensayo detecta la acumulación de un producto de PCR específico por hibridación y escisión de una sonda fluorogénica doblemente marcada (la sonda “TaqMan™”) durante la reacción de amplificación. La sonda fluorogénica consiste en un oligonucleótido marcado tanto con un colorante indicador fluorescente como con un colorante extintor. Durante la PCR, esta sonda se escinde por la actividad exonucleasa 5’ de la ADN polimerasa si, y sólo si, hibrida con el segmento que se está amplificando. La escisión de la sonda genera un aumento en la intensidad de la fluorescencia del colorante indicador.

Otro método para detectar productos de amplificación que se basa en el uso de la transferencia de energía es el método de “sonda baliza”,descrito por Tyagi y Kramer, Nature Biotech. 14: 303-309 (1996), que también es el objeto de las Patentes de Estados Unidos Nos. 5.119.801 y 5.312.728. Este método emplea sondas de hibridación de oligonucleótidos que pueden formar estructuras de horquilla. En un extremo de la sonda de hibridación (bien el extremo 5’ o bien el 3’), hay un fluoróforo donante, y en el otro extremo una fracciónaceptora. En el caso del método de Tyagi y Kramer, esta fracción aceptora es un extintor, es decir, el aceptor absorbe la energía liberada por el donante, pero después él mismo no emite fluorescencia. Por lo tanto, cuando la baliza está en la conformación abierta, la fluorescencia del fluoróforo donante es detectable, mientras que cuando la baliza está en conformación de horquilla (cerrada), la fluorescencia del fluoróforo donante se extingue. Cuando se emplea en la PCR, la sonda de baliza molecular, que hibrida con una de las cadenas de producto de la PCR, está en “conformación abierta”, y se detecta la fluorescencia, mientras que las que permanecen sin hibridar no emitirán fluorescencia (Tyagi y Kramer, Nature Biotechnol. 14:303-306 (1996)). Como resultado, la cantidad de fluorescencia aumentará a medida que aumenta la cantidad de producto de la PCR, y por tanto puede utilizarse como una medida del progreso de la PCR. Los expertos en la materia reconocerán que también están disponibles otrosmétodos de amplificación cuantitativa.

También se conocen diversas técnicas diferentes para llevar a cabo la amplificación cuantitativa de un ácido nucleico. Por ejemplo, algunas metodologías emplean uno o más oligonucleótidos sonda que se estructuran de modo que se genere un cambio en la fluorescencia cuando el oligonucleótido o los oligonucleótidos hibridan con un ácido nucleico diana. Por ejemplo, uno de dichos métodos implica una aproximación de fluoróforo doble que aprovecha la transferencia de energía por resonancia de fluorescencia (FRET), por ejemplo, sondas de hibridación LightCycler™, donde dos sondas oligo hibridan con el amplicón. Los oligonucleótidos se diseñan para hibridar en una orientación de cabeza a cola, con los fluoróforos separados a una distancia que sea compatible con una transferencia de energía eficaz. Otros ejemplos de oligonucleótidos marcados que están estructurados para emitir una señal cuando se unen con un ácido nucleico o se incorporan en un producto de extensión incluyen: sondas Scorpions™ (por ejemplo, Whitcombe et al., Nature Biotechnology 17:804-807, 1999, y Patente de Estados Unidos Nº 6.326.145), sondas Sunrise™ (o Amplifluor™) (por ejemplo, Nazarenko et al., Nuc. Acids Res. 25:2516-2521, 1997, y Patente de Estados Unidos Nº 6.117.635) y sondas que forman una estructura secundaria que da como resultado una señal reducida sin un extintor y que emite una señal aumentada cuando hibrida con una diana (por ejemplo, sondas Lux™).

En otras realizaciones, pueden utilizarse agentes intercaladores que producen una señal cuando se intercalan en ADN bicatenario. Los ejemplos de agentes incluyen SYBR GREEN™ y SYBR GOLD™. Debido a que estos agentes no son específicos del molde, se asume que la señal es generada en base a la amplificación específica del molde. Esto puede confirmarse monitorizando la señal en función de la temperatura, puesto que el punto de fusión de las secuencias molde será generalmente mucho mayorque,porejemplo,los dímeros de cebadores, etc.

VI. Kits

También se describen en la presente patente kits que comprenden componentes de utilidad para practicar los métodos. El kit puede comprender uno o ambos polinucleótidos de detección específicos de alelos (por ejemplo, cebadores o sondas), para cualquiera de las combinaciones de los SNP descritos en la presente patente. Tales polinucleótidos pueden, de manera opcional, fijarse a una membrana de soporte adecuada. Los kits pueden comprender un número suficiente de polinucleótidos para detectar una combinación de SNP, según se describe en la presente patente. El primer y el segundo SNP pueden seleccionarse del grupo que consiste en las SEQ ID Nos: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y16,opcionalmente en las que almenos un SNP es 1, 2, 3, 4, 5, o 6.

El kit puede comprender uno o más polinucleótidos de detección específicos de alelos (por ejemplo, cebadores o sondas) para cada una de las SEQ ID Nos: 1, 5, 8, 9, 10, 11, 14, 15 y 16. El kit puede comprender uno o ambos polinucleótidos de detección específicos de alelos (por ejemplo, cebadores o sondas) para cada una de las SEQ ID Nos: 1, 5, 8, 9, 10, 11, 12, 14, 15 o 16. El kit puede comprender uno o más polinucleótidos de detección específicos de alelos (por ejemplo, cebadores o sondas) para cada una de las SEQ ID Nos: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15 o

16. El kit puede comprender uno o más polinucleótidos de detección específicos de alelos (por ejemplo, cebadores o sondas) para cada una de las SEQ ID Nos: 1-16.

Uno, algunos, o todos los polinucleótidos para la detección de la combinación de los SNP pueden comprender una secuencia 100% idéntica a al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos, o al complemento de los mismos, de los SNP a ser detectados. Por ejemplo, si tres SNP van a ser detectados (designados arbitrariamente como A, B, y C), un kit puede comprender al menos tres polinucleótidos en donde:

el primer polinucleótido detecta (y opcionalmente comprende una secuencia 100% idéntica a al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos, o el complemento de los mismos, del SNP A;

el segundo polinucleótido detecta (y opcionalmente comprende una secuencia 100% idéntica a al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos, o el complemento de los mismos, del SNP B;

el tercer polinucleótido detecta (y opcionalmente comprende una secuencia 100% idéntica a al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos, o el complemento de los mismos, del SNP C.

La secuencia del polinucleótido de detección específico de alelo puede comprender o consistir en al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos directamente 5’ (o tiene 2 o 3 nucleótidos 5’) de la posición variable del SNP diana, y la secuencia está en el extremo 3’ del polinucleótido. Tales opciones se utilizan convenientemente para, por ejemplo, reacciones de extensión del cebador. La secuencia puede comprender o consistir en el complementodeal menos8 (por ejemplo, al menos10, 12,15)nucleótidoscontiguosdirectamente 3’ (o tiene 2 o 3 nucleótidos 3’) de la posición variable del SNP, y la secuencia está en el extremo 3’ del polinucleótido. Tales opciones se utilizan también convenientemente para, por ejemplo, reacciones de extensión del cebador.

La secuencia puede consistir en al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos, o el complemento de los mismos, del SNP, en donde una de las posiciones de la secuencia corresponde a la posición variable del SNP. Tales kits son de utilidad, por ejemplo, para ensayos en los que está implicada la hibridación diferencial con alelos del SNP.

Un kit de ese tipo puede también contener cebadores de amplificación para amplificar una región del locus del IGF2 que abarca el sitio polimórfico. De manera alternativa, los kits de utilidad pueden contener un conjunto de cebadores que comprenden un cebador específico de alelo para la amplificación específica de los alelos polimórficos. Un kit de ese tipo puede además comprender sondas para la detección de productos de amplificación. De forma alternativa, los kits de utilidad pueden contener un conjunto de cebadores complementarios a las secuencias 5’, pero no incluir las posiciones del SNP de interés (o complementos de los mismos) para su uso en los métodos de extensión de cebadores según se describe anteriormente.

Otros componentes opcionales de los kits incluyen reactivos utilizados adicionales para el genotipado de pacientes y/o la cuantificación de la cantidad relativa de alelos específicos presentes. Por ejemplo, un kit puede contener una polimerasa, nucleósido trifosfatos de sustrato marcados o no marcados (opcionalmente, donde algunos o cada nucleótido diferente están marcados con un marcador diferente distinguible, medios para marcar y/o detectar ácido nucleico, tampones apropiados para reacciones de amplificación o hibridación, y/o instrucciones para llevar a cabo el presente método.

De manera opcional, los kits comprenden muestras de ácido nucleico de control, por ejemplo, una muestra que comprende únicamente un posible alelo y opcionalmente un control que tiene dos (o, cuando corresponda, todos los tres) posibles alelos de un SNP en particular. Los controles pueden incluir al menos un ácido nucleico o mezcla de ácidos nucleicos de control para cada SNP (por ejemplo, con uno o ambos alelos). Los controles negativos y de otro tipo también pueden incluirse.

VII. Mezclas de reacción

También se describen en la presente patente mezclas de reacción para llevar a cabo la invención. En algunos modos de realización, las mezclas de reacción pueden comprender uno o ambos polinucleótidos de detección específicos de alelo (por ejemplo, cebadores o sondas) para cualquier combinación de lo SNP descritos en la

presente patente. Tales polinucleótidos pueden fijarse de manera opcional a una membrana de soporte adecuada. En algunos modos de realización, las mezclas de reacción comprenden una cantidad suficiente de polinucleótidos para la detección de una combinación de SNP según se describe en la presente patente. Por ejemplo, en algunos modos de realización, las mezclas de reacción pueden comprender un primer polinucleótido de entre 8-100 nucleótidos, en donde el primer polinucleótido distingue entre un alelo de un primer SNP (o un complemento del mismo) y el otro alelo del primer SNP (o un complemento del mismo) en una reacción de hibridación, un segundo polinucleótido de entre 8-100 nucleótidos, en donde el segundo polinucleótido distingue entre un alelo de un segundo SNP (o un complemento delmismo) y el otro alelo del segundo SNP (o un complemento delmismo) en una reacción de hibridación, en donde el primer y el segundo SNP se selecciona del grupo que consiste en las SEQ ID Nos:1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,y16,opcionalmente en donde almenos un SNPseselecciona de las SEQ ID Nos 1, 2, 3, 4, 5, o 6. Los ejemplos de combinaciones incluyen, pero no se limitan a:

SEQ ID Nos: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16; o

SEQ ID Nos: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o

SEQ ID Nos: 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o

SEQ ID Nos: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16.

En algunos modos de realización, la mezcla de reacción comprende uno o ambos polinucleótidos de detección específicos de alelo (por ejemplo, cebadores o sondas) para cada una de las SEQ ID Nos: 1, 5, 8, 9, 10, 11, 14, 15 y

16. En algunas realizaciones, la mezcla de reacción comprende uno o ambos polinucleótidos de detección específicos de alelo (por ejemplo, cebadores y sondas) para cada una de las SEQ ID Nos: 1, 5, 8, 9, 10, 11, 12, 14, 15 o 16. En algunas realizaciones, la mezcla de reacción comprende uno o ambos polinucleótidos de detección específicos de alelo (por ejemplo, cebadores y sondas) para cada una de las SEQ ID Nos: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15 o 16. En algunas realizaciones, la mezcla de reacción comprende uno o ambos polinucleótidos de detección específicos de alelo (por ejemplo, cebadores y sondas) para cada una de las SEQ ID Nos: 1-16.

En algunos modos de realización, uno, algunos, o todos los polinucleótidos para la detección de la combinación de los SNP comprenden una secuencia 100% idéntica a al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos, o un complemento de los mismos, de los SNP a ser detectados. Por ejemplo, si tres SNP van a ser detectados (designados arbitrariamente como A, B, y C), un kit puede comprender al menos tres polinucleótidos en donde:

el primer polinucleótido detecta (y opcionalmente comprende una secuencia 100% idéntica a al menos 8 (por ejemplo, almenos 10, 12, 15) nucleótidos contiguos, o el complemento de los mismos, del SNP A;

el segundo polinucleótido detecta (y opcionalmente comprende una secuencia 100% idéntica a al menos 8 (por ejemplo, almenos 10, 12, 15) nucleótidos contiguos, o el complemento de los mismos, del SNP B;

el tercer polinucleótido detecta (y opcionalmente comprende una secuencia 100% idéntica a al menos 8 (por ejemplo, almenos 10, 12, 15) nucleótidos contiguos, o el complemento de los mismos, del SNP C.

En algunos modos de realización, la secuencia comprende o consiste en al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos directamente 5’ (o tiene 2 o 3 nucleótidos 5’) de la posición variable del SNP diana, y la secuencia está en el extremo 3’ del polinucleótido. Tales opciones se utilizan convenientemente para, por ejemplo, reacciones de extensión del cebador. En algunas realizaciones, la secuencia comprende o consiste en el complemento de al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos directamente 3’ (o tiene 2 o 3 nucleótidos 3’) de la posición variable del SNP, y la secuencia está en el extremo 3’ del polinucleótido. Tales opciones se utilizan también convenientemente para, por ejemplo, reacciones de extensión del cebador.

En algunos modos de realización, la secuencia consiste en al menos 8 (por ejemplo, al menos 10, 12, 15) nucleótidos contiguos, o el complemento de los mismos, del SNP, en donde una de las posiciones de la secuencia corresponde a la posición variable del SNP. Tales modos de realización son de utilidad, por ejemplo, para ensayos en los que está implicada la hibridación diferencial con alelos del SNP.

Las mezclas de reacción de este tipo pueden también contener cebadores de amplificación para amplificar una región del locus del IGF2 que abarca el sitio polimórfico. De manera alternativa, las mezclas de reacción pueden contener un conjunto de cebadores que comprenden un cebador específico de alelo para la amplificación específica de los alelos polimórficos. Las mezclas de reacción de ese tipo pueden además comprender sondas para la detección de productos de amplificación. De forma alternativa, las mezclas de reacción de utilidad pueden contener un conjunto de cebadores complementarios a las secuencias 5’, pero no incluir las posiciones del SNP de interés (o complementos de los mismos) para su uso en los métodos de extensión de cebadores según se describe anteriormente.

Otros componentes opcionales de las mezclas de reacción incluyen reactivos adicionales utilizados para el genotipado de pacientes y/o la cuantificación de la cantidad relativa de alelos específicos presentes. Por ejemplo, un kit puede contener una polimerasa, nucleósido trifosfatos de sustrato marcados o no marcados (opcionalmente, donde algunos o cada nucleótido diferente están marcados con un marcador diferente distinguible, medios para marcar y/o detectar ácido nucleico, tampones apropiados para reacciones de amplificación o hibridación, y/o instrucciones para llevar a cabo el presente método. De manera opcional, las mezclas de reacción incluyen una muestra de ácido nucleico procedente de un humano.

VIII. Controles para validar las mediciones de LOI

Un ensayo que determina el estado de la impronta del IGF2 en una muestra clínica implica una determinación de la relación de la cantidad de expresión de un alelo del gen y la cantidad de expresión del otro alelo, y una comparación de la relación con un valor de corte asociado con la pérdida de impronta del gen, y/o asociado con un factor clínico tal como la presencia de cáncer, el riesgo de cáncer o la selección de un régimen de tratamiento para el paciente.

Las mediciones del estado de la impronta del IGF2 están sujetas a muchos factores de proceso que tienen el potencial para introducir error ya sea aleatorio o sistemático en la medición del ensayo, y por lo tanto tienen el potencial de reducir la precisión de los resultados de las mediciones. Por ejemplo, los ensayos de estado de impronta requieren habitualmente múltiples etapas. Estas etapas pueden incluir el aislamiento del ARN de la muestra, la transcripción inversa de ARN en ADNc de la 1ª cadena, la síntesis de la segunda cadena del ADNc de la 1ª cadena en un ADNc de la 2ª cadena, la amplificación del ADNc en ADNc amplificado, y la cuantificación basada en SNP de las copias de ADNc amplificadas que surgen de cada alelo transcrito del gen en la muestra.

En el entorno de los ensayos clínicos, en ocasiones, podrían utilizarse diferentes lotes de reactivos, diferente equipo, diferente personal de laboratorio, e incluso diferentes procedimientos operativos estándar para medir la misma muestra clínica múltiplesveces,o de manera opcional para medirdiferentes muestras clínicas. Un ensayo que mide más de un SNP heterocigoto puede contener componentes que difieren para cada SNP medido. Por ejemplo, pueden utilizarse diferentes cebadores RT para someter a transcripción inversa diferentes regiones de la secuencia del transcrito, o pueden utilizarse diferentes cebadores de PCR para amplificar ADNc de diferentes regiones de la secuencia, o pueden utilizarse diferentes sondas de detección para detectar las opciones polimórficas de los diferentes SNP del panel.

Si cualquier etapa o cualquier componente del ensayo en un estado de impronta determinado conduce a un sesgo de la amplificación específica de alelo,odeforma opcional aunsesgo de la detección específica de alelo,entonces dicha etapa o componente efectuará la relación medida de los alelos e introducirá un error en la relación del estado de la impronta resultante. Por lo tanto, resulta de utilidad desarrollar controles que pueden ser utilizados para medir la variación de las etapas y componentes de cualquier medición del estado de la impronta determinada, y que permita la corrección de estas mediciones, dando como resultado unos resultados de las mediciones mejorados.

Una fuente preferida de controles para los ensayos que miden los paneles de SNP optimizados descritos en la presente patente, serían el ADN o ARN aislado de un único par de individuos, en los que un individuo es homocigoto para un alelo de cada SNP en un panel determinado, y el otro individuo es homocigoto para el otro alelo de cada SNP en el panel. Sin embargo, debido a las frecuencias de heterocigosidad combinadas de los SNP de los paneles optimizados en la población en general, la probabilidad de encontrar dicho par de individuos es extremadamente baja.

Una fuente opcional de controles para los ensayos que miden los paneles optimizados de los SNP descritos en la presente patentees el ADN y/o el ARN obtenido a partirde un conjunto demúltiplesparesde individuos;donde,en cada par de individuos, un individuo es homocigoto para un alelo de un SNP determinado (por ejemplo, es homocigoto para el alelo de G en una posición G/A del nucleótido del SNP) y el otro individuo es homocigoto para el otro alelo delmismo SNP (por ejemplo, es homocigoto para el alelo de A en la misma posición G/A del nucleótido del SNP); y donde el conjunto de múltiples pares de individuos representa las diferentes opciones alélicas de todos los SNP en un panel optimizado. Identificando dicho conjunto de pares de individuos, podrían establecerse las fuentes representativas del ADN o del ARN útiles para controlar cada SNP. Sin embargo, el uso de múltiples pares de controles, donde cada par representa uno o unos pocos SNP,necesitaría la generación y uso de múltiples curvas de control, y esto a su vez aumentaría enormemente la complejidad del ensayo, el coste del ensayo, y el error acumulativo de los controles, erosionando de ese modo el poder de una comparación entre ensayos de relaciones basadas en ASE, determinadas entre múltiples SNP heterocigotos dentro de la misma muestra clínica.

Para abordar estos problemas, un aspecto de la revelación proporciona secuencias de ácido nucleico sintéticas de control para los ensayos de LOI del IGF2 y métodos para la utilización de los controles. Los ácidos nucleicos de

control de la revelación (también denominados en la presente patente como “pares de control de LOI”), son pares de polinucleótidos que representan alelos y los alelos alternativos de al menos dos SNP del IGF2. Por tanto, un miembro del par comprende al menos dos SNP del IGF2, por ejemplo, al menos dos de los SNP del IGF2 del exón 9 mostrados en las SEQ ID Nos. 1-16, o el complemento de los mismos. El nucleótido complementario a uno de los alelos del SNP (un primer SNP) está presente en uno de los miembros del par; un nucleótido complementario a un alelo alternativo del primer SNP está presente en el segundo miembro del par. De forma similar, para el segundo SNP del IGF2 para el control, un miembro de par comprende un nucleótido complementario a uno de los alelos del segundo SNP y el otro miembro del par comprende un nucleótido complementario a un alelo alternativo del segundo SNP. En la siguiente descripción del par de control de ácidos nucleicos, las referencias a las SEQ ID Nos de referencia, también hacen referencia a la secuencia complementaria de las SEQ ID Nos, incluso aunque pueda no estar indicado explícitamente.

Un “parde controldelaLOI”de la revelaciónseencuentra“sustancialmente libre”de ácidos nucleicos celulares;por tanto, los ácidos nucleicos están sustancialmente libres de ADN genómico, ARN, y similares de una célula humana u hospedadora, por ejemplo, una célula hospedadora bacteriana. Por ejemplo, el par de control puede ser obtenido utilizando una reacción de transcripción in vivo. Al estar sustancialmente libre de ácidos nucleicos, el par de control de la LOI puede ser almacenado en mezclas a altas concentraciones y en la presencia de estabilizadores del ácido nucleico, para permanecer sin degradar durante largos periodos de tiempo, y puede ser diluido a volúmenes de trabajo en el momento en el que los ensayos de impronta se ejecutan sobre las muestras clínicas para servir como control.

El par de polinucleótidos de control puede representar cualquier número de SNP, por ejemplo, el par de control puede tener 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, o 16, o más, SNP del IGF2, donde uno de los miembros del par tiene un nucleótido para uno de los alelos del SNP para cada uno de los diferentes SNP, y el segundo miembro del par tiene un nucleótido para un alelo alternativo para cada uno de esos SNP. En algunos modos de realización, un miembro del par puede tener nucleótidos de alelo menores para 2 o más, por ejemplo, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, o 16, de los SNP. Por ejemplo, para un par de ácidos nucleicos de control de LOI para diez de los SNP mostrados en las SEQ ID Nos 1-16, un miembro del par puede tener los nucleótidos para un alelo menor para todos los diez SNP, y el otro miembro del par puede tener nucleótidos para todos los aleos principales de los diez SNP. De manera alternativa, por ejemplo, un miembro del par puede tener el nucleótido para un alelo menos para dos de los diez SNP, donde los otros ocho nucleótidos del SNP son para alelos principales; y el otro miembro del par tiene los nucleótidos para los alelos principales de los dos SNP y los alelos menores para los otros ocho SNP.

En algunos modos de realización, los polinucleótidos que constituyen el par de control de LOI se encuentran en cualquier lugar de 40 nucleótidos hasta aproximadamente 3600 o 4000 nucleótidos, o 4500, 5000, o 6,000 nucleótidos, de longitud. En algunas realizaciones, el par de control de LOI es de 40, 50, 60, 70, o 80 nucleótidos de longitud hasta 100, 200, 300, 400, 600, 800, 1000, 1500, 2000, 2500, o 3000 nucleótidos de longitud. Los elementos del par pueden ser de la misma longitud o de longitud diferente.

El par de polinucleótidos de control puede comprender cualquier SNP presente en un transcrito del IGF2, incluyendo SNP presentes en el exón 9, exón 8, y exón 7. En algunas realizaciones, el par de LOI comprende SNP del exón 9.

En algunos modos de realización, un polinucleótido de control de LOI miembro del par de ácido nucleico tiene una secuencia de ácido nucleico 3’ adyacente al primer SNP (denominada en la presente patente como “secuencia adyacente 3’”) que essustancialmente idéntica a almenos 15 nucleótidos contiguos, habitualmente al menos 20, 25,

o 50 nucleótidos contiguos, a la correspondiente región de un transcrito del IGF2, por ejemplo, SEQ ID NO 17 o SEQ ID NO:18; y tiene una secuencia adyacente 3’ para el segundo SNP que es sustancialmente idéntica a al menos 15 nucleótidos contiguos, habitualmente al menos 20, 25, o 50, nucleótidos contiguos, de la correspondiente región de un transcrito del IGF2, por ejemplo, SEQ IDNO 17oSEQ IDNO: 18.En algunosmodosde realización,almenos 8 nucleótidos contiguos, o al menos 10, 12, 15, 20, o 25 nucleótidos contiguos, de la secuencia de ácido nucleico 3’ adyacente al primer SNP son idénticos a la correspondiente región de un transcrito del IGF2, por ejemplo, SEQ ID NO: 17 o SEQ ID NO:18; y al menos 8 nucleótidos contiguos, o al menos 10, 12, 15, 20, o 25 nucleótidos contiguos, de la secuencia de ácido nucleico 3’ adyacente al segundo SNP son idénticos a la correspondiente región de la SEQ ID NO: 17 o SEQ ID NO: 18. En el contexto de esta revelación, según se relaciona con la descripción del par de control de ácidos nucleicos sintéticos, “secuencia de ácido nucleico 3’ adyacente a un SNP" hace referencia a una secuencia de ácido nucleico inmediatamente 3’ de la posición del SNP, que incluye el nucleótido 3’ en el sitio del SNP.

En algunos modos de realización, un polinucleótido de control de LOI miembro del par de ácido nucleico tiene una secuencia de ácido nucleico 3’ adyacente al primer SNP que es sustancialmente idéntico a al menos 15 nucleótidos contiguos,habitualmentealmenos20,25,o50nucleótidoscontiguos,a la correspondienteregióndeuna secuencia de ácido nucleico del IGF2 que comprende sitios polimórficos del exón 9, por ejemplo, SEQ ID NO:21 o SEQ ID NO:23; y tiene una secuencia 3’ adyacente para el segundo SNP que es sustancialmente idéntica a al menos 15 nucleótidos contiguos, habitualmente al menos 20, 25, o 50, nucleótidos contiguos, de la correspondiente región de una secuencia de ácido nucleico del IGF2, por ejemplo, SEQ ID NO:21 o SEQ ID NO:23. En algunos modos de realización,al menos 8 nucleótidos contiguos, o almenos 10, 12, 15, 20, o 25 nucleótidos contiguos,de la secuencia de ácidonucleico3’adyacentealprimerSNP es idénticaa la correspondienteregiónde unasecuencia de IGF2 por ejemplo, SEQ ID NO:21 o SEQ ID NO:23; y al menos 8 nucleótidos contiguos, o al menos 10, 12, 15, 20, o 25 nucleótidos contiguos, de la secuencia de ácido nucleico 3’ adyacente al segundo SNP es idéntica a la correspondiente región de la SEQ ID NO:21 o SEQ ID NO:23.

Los términos “idéntico” o “100% de identidad”, en el contexto de dos o más ácidos nucleicos hacen referencia a dos

o más secuencias o sub-secuencias que son las mismas secuencias. Dos secuencias son “sustancialmente idénticas” o idénticas en un cierto porcentaje si dos secuencias tienen un porcentaje especificado de residuos de aminoácidos o nucleótidos que son los mismos (es decir, un 70% de identidad, de manera opcional un 75%, 80%, 85%, 90%, o 95% de identidad, sobre una región que se específica, o, cuando no se especifica, sobre la totalidad de la secuencia), cuando se compara y se alinea para determinar una correspondencia máxima sobre una ventana de comparación,o una región designadacomomedidautilizando algoritmosde comparación de secuencias conocidos, por ejemplo, BLASTutilizando los parámetros por defecto, o mediante alineamiento manual e inspección visual.

En algunos modos de realización, al menos uno de los SNP incluidos en el par de control se selecciona del grupo que consiste en los SNP según se muestra en las SEQ ID Nos: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16. En modos de realización habituales, en al menos dos de los SNP mostrados en las SEQ ID Nos. 1-16 están incluidos en el par de ácido nucleico de control. A menudo, al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, o todos los 16 SNP que se muestran en las SEQ ID Nos. 1-16 están incluidos en el par de ácido nucleico de LOI de control. En algunas realizaciones, al menos uno de los SNP de control se selecciona de SEQ ID NO: 1, 2, 3, 4, 5, o

6. En algunas realizaciones, el par de ácido nucleico de LOI de control comprende los SNP mostrados en las SEQ ID Nos: 1, 5, 8, 9, 10, 11, 14, 15, y 16; SEQ ID Nos. 1, 5, 8, 9, 10, 11, 12, 14, 15, y 16; o SEQ ID Nos. 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16.

En algunas realizaciones, el primer miembro de un par de control de ácidos nucleicos de la invención que tiene al menos dos SNP del IGF2,comprende un polinucleótidoque tiene almenos8 nucleótidos contiguos,o almenos 10, 12,15,20,25,o30 nucleótidoscontiguos,queincluyen el sitiodel SNP,deunalelodeun SNPmostrado en la SEQ ID NO:1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, o 16, o el complemento del mismo; y el segundo sitio del SNP del IGF2 presente en el primer miembro del polinucléotido de control tiene al menos 8 nucleótidos contiguos, o al menos 10, 12, 15, 20, 25, o 30 nucleótidos contiguos, que incluyen el sitio del SNP, de un alelo de un diferente SNP mostrado en la SEQ ID NO:1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, o 16, o el complemento del mismo. El segundo miembrodel parde controltiene lamisma secuenciade polinucleótidos que el primermiembro del par,sin embargo, los nucleótidos presentes en las posiciones polimórficas corresponden a alelos alternativos de los dos SNP.

En algunos modos de realización, dicho miembro de un par de control de ácidos nucleicos de la invención tiene al menos un 70% de identidad, habitualmente al menos un 80% de identidad, al menos un 90% de identidad, o al menos un 95%, 96%, 97%, 98%, 99%, o un 100% de identidad, con la SEQ ID NO: 21 o SEQ ID NO:23 e incluye los SNP que se muestran en las SEQ ID Nos. 1-16. En algunas realizaciones, el segundo miembro de un par de control de ácidos nucleicos de la invención tiene al menos un 70% de identidad, habitualmente al menos un 80% de identidad, almenos un 90% de identidad, o al menos un 95%, 96%, 97%, 98%, 99%, o un 100% de identidad, con la SEQ ID NO 21 o SEQ ID NO:23 e incluye alelos alternativos de los SNP mostrados en las SEQ ID NOs. 1-16.

En algunos modos de realización, el primer miembro de un par de control de ácidos nucleicos de la invención que tiene al menos dos SNP del IGF2 comprende un polinucleótido que tiene al menos 8 nucleótidos contiguos, o al menos 10, 12, 15, 20, 25, 30, 35, 40, 50, o 100 nucleótidos contiguos, que incluyen al menos un sitio del SNP, de SEQ ID NO:21 o SEQ ID NO:23.

En algunos modos de realización, los polinucleótidos que están comprendidos en el par de control de la LOI tienen sustancialmente la misma secuencia quela SEQ ID NO:20, o el complemento de la misma, sin embargo, comprende menos de 500 nucleótidos de la región polimórfica rica en CA. La región polimórfica rica en CA de SEQ ID NO:20 tiene lugar entre las posiciones 1115 y 1692 de la SEQ ID NO:20, y está inmediatamente flanqueada por las posiciones 1168 y 1169 de la secuencia de nucleótidos mostrada en la SEQ ID NO:21. La región rica en CA de la SEQ ID NO:20 se proporciona en la SEQ ID NO:22. Por tanto, en algunosmodos de realización, el primer y segundo polinucleótido del par de control comprenden sustancialmente la misma secuencia que la SEQ ID NO:20, pero comprende menos de 500 nucleótidos de la SEQ ID NO:22. En algunas realizaciones, los polinucleótidos de control de la LOI pueden contener secuencias adicionales para facilitar la amplificación específica. Por ejemplo, en los casos en que el control comprende SNP del exón 9 del IGF2, pueden incorporarse secuencias adicionales del extremo 3’ del exón 8 del IGF2 a la secuencia 5’ de un polinucleótido de control.

El ácido nucleico de control puede ser un ARN o un ADN u otro ácido nucleico del apareamiento de bases. En algunos modos de realización, los polinucleótidos que corresponden a los miembros del par se encuentran ligados de forma operativa a un promotor de la ARN polimerasa, por ejemplo, un promotor T7, de manera que los transcritos pueden ser realizados a partir del polinucleótido para proporcionar un control de ARN. En algunos modos de realización, los polinucleótidos pueden estar ligados a promotores en vectores independientes de tal manera que un vector codifica un miembro del par de control y un vector diferente codifica el otro miembro del par. Los pares de ácido nucleico de control pueden ser obtenidos utilizando métodos bien conocidos en el arte. Por ejemplo, en algunosmodosderealización,porejemplo,para paresenlosque cadamiembro tienemenosde 100nucleótidosde longitud, los polinucleótidos pueden sintetizarse químicamente. En realizaciones habituales, los polinucleótidos de control pueden obtenerse utilizando reacciones de amplificación.

En algunas realizaciones, los miembros del par de control de la LOI están separados. En el contexto de la presente revelación, “separado” significa que los miembros de un par no están presentes en la misma mezcla o solución. En algunosmodos de realización, losmiembros del par están presentes en una mezcla juntos.

En un aspecto adicional, la revelación proporciona una mezcla que comprende un par de control de la LOI. En algunos modos de realización, los miembros del par están presentes en cantidades equimolares. En algunas realizaciones, los miembros del par están presentes en una relación molar, por ejemplo, de 1:2, 1:4, 1:8, y similar. En algunas realizaciones, la revelación proporciona una pluralidad de mezclas, en las que cada mezcla contiene una cantidad pre-determinada de miembros delpar.Por ejemplo, la revelación proporciona unapluralidadde mezclas en las que las mezclas tienen los miembros individuales del par presentes en una relación de 10:1, 8:1, 6:1, 4:1, 3 :1, 2:1, 1:1, 1:2, 1:3, 1:4, 1:6, 1:8 y 1:10.

En algunos modos de realización, la mezcla puede comprender un segundo par de control de la LOI de ácidos nucleicos aislados, sustancialmente libres de ácidos nucleicos celulares, en donde ambos miembros del segundo par comprenden al menos una secuencia de SNP del IGF2 en la que la secuencia o secuencias de SNP del IGF2 en el segundo par es diferente de los SNP del IGF2 en el primer par. Por tanto, se puede evaluar la LOI en diversos SNP del IGF2,porejemplo,losSNPmostrados en la SEQ IDNO:1, 2, 3, 4, 5, 6, 7,8,9, 10, 11,12,13, 14, 15,o16, utilizando un par de control de polinucleótidos, donde cada polinucleótido tiene todos los 16 SNP, o se puede evaluar utilizando múltiples pares de control de ácidos nucleicos, por ejemplo, 2 pares, 3 pares, 4 pares, 5 pares, 6 pares, 7 pares, u 8 pares, o más.

La revelación proporciona adicionalmente un kit que comprende pares de ácidos nucleicos de control de la LOI, según se describen en la presente patente. Los ácidos nucleicos de control pueden ser proporcionados en el kit en una mezcla. De manera alternativa, el kit puede ser proporcionado con los dos miembros del par de control en recipientes separados. En algunos modos de realización, un kit de la invención comprende uno o más vectores de transcripción que comprenden polinucleótidos que codifican los miembros del par.

En algunos modos de realización, un kit de la revelación comprende un segundo par de ácidos nucleicos de control de la LOI del IGF2, en donde ambos miembros del segundo par comprenden al menos una secuencia de SNP del IGF2, y en donde la al menos una secuencia de SNP del IGF2 en el segundo par es diferente de los SNP del IGF2 en el primer par. En algunas realizaciones el segundo par de ácidos nucleicos de control está en un recipiente diferente del primer par de ácidos nucleicos.

Un kit de la revelación que comprende un par de control de ácidos nucleicos del IGF2 puede además comprender cualquiera de los reactivos, incluyendo cebadores y sondas, descritos en la sección referente a los Kits.

La revelación proporciona métodos para utilizar el par de control de ácidos nucleicos en un ensayo de LOI del IGF2 como control para validar las condiciones del ensayo. Un método de la invención comprende habitualmente cuantificar de las copias maternal y paternal del ADN genómico o ARN celular del IGF2, según se describe en la presente patente, utilizando oligonucleótidos que distinguen entre un alelo del SNP y un segundo alelo del SNP; cuantificar el SNP; utilizar un par de control de oligonucleótidos en los que los miembros del par están presentes en una relación conocida y cuantificar la relación de los miembros del par de control que es detectado en realidad en el ensayo, y comparar esta relación con la relación de las copias maternal y paternal cuantificadas en la muestra del paciente. Esto proporciona un medio de validar las condiciones del ensayo de genotipado o del estado de la impronta, y además cuantificar las cantidades reales del ADN o ARN genómico del IGF2 maternal vs. el paternal en la muestra del paciente.

IX. Gestión del cáncer

La LOI del IGF2 está asociada con, por ejemplo, la presencia de cáncer y puede estar asociada con una predisposición al cáncer, además de predecir la eficacia del tratamiento del cáncer utilizando diversos fármacos. Ver, por ejemplo, el documento WO2004/003003; Kaneda et al. Proc. Natl. Acad. Sci. USA 104(52): 20926-20931 (2007). Por consiguiente, la detección de la LOI en el IGF2 según se describe en la presente patente, puede utilizarse en el diagnóstico, pronóstico, clasificación, predicción del riesgo de cáncer, detección de recurrencia del cáncer, y la selección de un tratamiento para diversos tipos de cáncer. Puede detectarse un cáncer en cualquier etapa de progresión, tal como tipos de cáncer primarios, metastásicos y recurrentes. Puede encontrarse información en referencia a numerosos tipos de cáncer, por ejemplo, en la Sociedad Americana del Cáncer (disponible en la Web en cancer.org), o en, por ejemplo, Harrison’s Principles of Internal Medicine, Kaspar, et al., eds., 16ª Edición, 2005, McGraw-Hill, Inc. Los ejemplos de tipos de cáncer que pueden detectarse incluyen cáncer de vejiga, de mama, cervical, coriocarcinoma, neoplasia colorrectal (adenoma colorrectal o cáncer colorrectal), cáncer de esófago, adenocarcinoma gástrico, glioma, cáncer hepatocelular, leucemia mieloide aguda, leucemia mielógena crónica, cáncer de pulmón, meduloblastoma, cáncer de próstata, mesotelioma, cáncer de ovarios, carcinoma de células renales,cáncer de células germinales testiculares ycáncer uterino.

La presenteinvención se puede utilizarpara determinarsiunmamífero (porejemplo,un humano)tieneo no cáncer, si una muestra biológica tomada de un mamífero contiene o no células cancerígenas, para calcular el riesgo o la probabilidad de que un mamífero desarrolle cáncer, clasificar tipos y etapas del cáncer, monitorizar la eficacia del tratamiento contra el cáncero seleccionar el tratamiento anticancerígeno apropiado en un mamífero con cáncer.

En algunas realizaciones, la muestra biológica comprende una muestra tisular de un tejido que se sospecha contiene células cancerígenas. Por ejemplo, en un individuo que se sospecha que tiene cáncer, puede evaluarse el tejido mamario, tejido linfático, tejido pulmonar, tejido cerebral o sangre. De forma alternativa, puede evaluarse tejido pulmonar, renal, hepático, de los ovarios, de cabeza y cuello, del tiroides, de vejiga, cervical, de colon, endometrial, delesófago,depróstata o cutáneo.Eltejidoo las célulaspuedenobtenersemediante cualquier método conocido en el arte incluyendo, por ejemplo, mediante cirugía, biopsia, flebotomía, hisopo, secreción del pezón, heces, etc. En otro modo de realización, una muestra de tejido que se sabe contiene células cancerígenas, por ejemplo, de un tumor, se analizarán para valorar el estado de LOI, para determinar información acerca del cáncer, por ejemplo, la eficacia de ciertos tratamientos, la expectativa de supervivencia del individuo, etc. En algunas realizaciones, los métodos se utilizarán junto con métodos de diagnóstico adicionales, por ejemplo, la detección de otros biomarcadores del cáncer, etc.

Los métodos de la invención pueden utilizarse para evaluar individuos que se sabe o se sospecha que tienen cáncer, o como un ensayo clínico de rutina, es decir,enunindividuodelquenosepiensanecesariamenteque tiene cáncer. Pueden realizarse ensayos de diagnóstico adicionales para confirmar el estado del cáncer en el individuo.

Además, los presentes métodos pueden ser utilizados para evaluar la eficacia del curso de un tratamiento. Por ejemplo, puede evaluarse la eficacia de un tratamiento anticancerígeno monitorizando la LOI a lo largo del tiempo en un mamífero que tenga cáncer. Por ejemplo, una reducción o ausencia de LOI en el IGF2 en una muestra biológica tomada de un mamífero después de un tratamiento, en comparación con un nivel en una muestra tomada del mamíferoantesde,oenun momentomásinicialen el tratamiento,puede indicar un tratamiento eficaz.Además,un individuo puede ser sometido a exploración para valorar la LOI del IGF2 antes de la selección de un fármaco apropiado ya sea para la prevención del cáncer o para el tratamiento del cáncer. Por ejemplo, una vez que se detecta una LOI, el paciente es probablemente un buen candidato para un inhibidor del IGF1R, que puede tomarse bien como terapia preventiva si se observa que el paciente no tiene cáncer y se cree que existe un aumento del riesgo de desarrollar cáncer en el futuro, o bien puede tomarse como quimioterapia si se observa que el paciente tiene cáncer para de tratar la enfermedad existente. Ver, por ejemplo, Kaneda et al., mencionado anteriormente.

En algunos modos de realización, los métodos comprenden registrar un diagnóstico, pronóstico, evaluación de riesgo o clasificación, en base al estado determinado de la LOI de un individuo. Se contempla cualquier tipo de registro, incluyendo el registro electrónico, por ejemplo, mediante un ordenador.

X. Métodos basados en ordenador

Los cálculos para los métodos descritos en la presente patente pueden implicar cálculos y herramientas basadas en ordenador. Por ejemplo, la LOI puede determinarse utilizando los datos generados segúnsedescribe en la presente patente. Por ejemplo, las entradas de datos en relación a la presencia, ausencia o cantidad de cada alelo de un SNP, que opcionalmente también incluyen información del genotipo acerca de un individuo, se pueden utilizar de forma aislada, o en comparación con mediciones similares realizadas de un par de ácidos nucleicos de control para generar una LOI prevista. Las herramientas se proporcionan de manera ventajosa en forma de programas de ordenador que son ejecutables mediante un sistema de ordenador de uso general (denominado en la presente patente como un “ordenador central”) de diseño convencional. El ordenador central puede estar configurado con muchos componentes de hardware diferentes y puede estar realizado en muchas dimensiones y estilos (por ejemplo, un PC de sobremesa, ordenador portátil, ordenador Tablet, ordenador de mano, servidor, estación de trabajo, procesador central). Los componentes estándar, tales como monitores, teclados, unidades de disco, unidadesdeCDy/o DVD, ysimilares,puedenserincluidos.En los casos en que elordenadorcentralesté acoplado a una red, las conexiones pueden proporcionarse a través de cualquier medio de trasnporte adecuado (por ejemplo, medios por cable, ópticos, y/o inalámbricos) y cualquier protocolo de comunicación adecuado (por ejemplo, TCP/IP); el ordenador central pueden incluir cualquier hardware para trabajo en red (por ejemplo, modem, tarjeta Ethernet, tarjeta WiFi). El ordenador centra puede implementar cualquiera de entre una variedad de sistemas operativos, que incluyen UNIX, Linux, Microsoft Windows, MacOS, o cualquier otro sistema operativo.

El código informático para los aspectos de implementación de la presente invención puede escribirse en una variedad de lenguajes, que incluyen PERL, C, C++, Java, JavaScript, VBScript, AWK, o cualquier otro lenguaje de script o de programación que pueda ser ejecutado en el ordenador principal o que pueda ser compilado para ejecutarse en el ordenador central. El código puede también ser escrito o distribuido en lenguajes de bajo nivel, tales como lenguaje ensamblador o lenguaje de máquina.

El sistema del ordenador central proporciona de manera ventajosa una interfaz a través del cual el usuario controla la operación de las herramientas. En los ejemplos descritos en la presente patente, las herramientas de software son implementadas como scripts (por ejemplo, utilizando PERL), la ejecución de los cuales puede ser iniciada por un usuario a partir de una interfaz de línea de comando estándar de un sistema operativo tal como Linux o UNIX. Los expertos en el arte apreciarán que los comandos pueden adaptarse al sistema operativo según sea apropiado. En otros modos de realización, puede proporcionarse un interfaz de usuario gráfico, lo que permite al usuario controlar las operaciones utilizando un dispositivo puntero. Por tanto, la presente invención no está limitada a una interfaz de usuario en particular.

Los scripts o programas que incorporan diversas características de la presente invención pueden estar codificados en varios medios legibles por ordenador para su almacenamiento y/o transmisión. Ejemplos de medios adecuados incluyen disco o cinta magnética, medios de almacenamiento ópticos tales como disco compacto (CD) o DVD (disco versátil digital), memoria flash, y señales portadoras adaptadas para la transmisión por redes por cable, ópticas, y/o inalámbricas que conforman una variedad de protocolos, incluyendo el Internet.

EJEMPLOS

Los siguientes ejemplos se ofrecen para ilustrar, pero no para limitar la invención reivindicada.

Ejemplo 1. Descubrimiento y validación independiente de SNP dentro del exón 9 del gen IGF2

Se ha descrito previamente una colección de SNP dentro del exón 9 del gen IGF2. Para identificar SNP no caracterizados previamente, se diseñaron 12 amplicones de PCR que abarcan la mayoría del exón 9 de IGF2. Cada uno se utilizó para amplificarun amplicón de PCR a partir de ADN genómico obtenido de un panel de 571 individuos, incluyendo 433 muestras que son parte de la colección del Proyecto HapMap Internacional. El panel de 571 individuos incluía un sub-panel de 207 individuos caucásicos (96 de la colección del Panel de Variación genética Humana del instituto Coriell, que incluía individuos caucásicos sanos no relacionados que eran residentes en Utah con ancestros de Europa del norte y occidental, y 111 individuos de los que se obtuvieron comercialmente muestras de sangre). Este sub-panel se denomina de aquí en adelante como el panel Caucásico y se indica como (CAU). El panel de 571 individuos además incluía un sub-panel de 96 individuos no relacionados sanos con ascendencia africana en el suroeste de los Estados Unidos (del Panel de Variación Humana de Coriell HD100A). Este sub-panel se denomina como el panel afroamericano y se indica como (AA). El panel de 571 individuos además incluía un subpanel de 96 individuos no relacionados sanos de origen mejicano (del Panel de Variación Humana de CoriellHD100MEX). Cada individuo en este sub-panel era de de la Comunidad Méjico-Americana de Los Ángeles, cada uno con tres o cuatro abuelos nacidos en Méjico). Este sub-panel se denomina de aquí en adelante como el panel de ascendencia mejicana y se indica como (MEX). El panel de 571 individuos además incluía un sub-panel de 88 individuos Japoneses no relacionados de Tokio, Japón (Colección internacional Hapmap Project HAPMAPPT02 y HAPMAPPT05). Este sub-panel se denomina de aquí en adelante como el panel Japonés y se indica como (JPN). El panel de 571 individuos además incluía un sub-panel de 84 individuos Chinos Han no relacionados de Beijing, China (colección Hapmap Project internacional HAPMAPPT02 y HAPMAPPT05). Este sub-panel se denomina de aquí en adelante el panel chino y se indica como (CHI). Los amplicones generados de cada uno de los 571 individuos se secuenciaron en ambas direcciones. Las secuencias se ensamblaron y se alinearon, y se identificaron los SNP mediante una línea de análisis automatizada basada en polyphred y polyscan, y se confirmaron mediante revisión humana. Previamente se registró la confirmación de 65 SNP identificados con antelación, y la identificación de 47 SNP putativos no publicados anteriormente en el exón 9 del IGF2 (PCT/L1S2008/072356).

Para confirmar adicionalmente los SNP y obtener frecuencias de heterocigosidad para los SNP seleccionados, los ensayos de genotipado basados en la extensión del cebador fueron diseñados para los SNP que se determinó que eran heterocigotos, mediante secuenciación de ADN, en más de un 1% de los individuos dentro de una población étnica. Se diseñaron diversos amplicones de PCR para que incluyeran uno o más nucleótidos del SNP a ser analizado. Estos se utilizaron para amplificar los productos de la PCR de los sub-paneles apropiados de muestras de ADN genómico de los individuos. Para ensayos de extensión del cebador de un único nucleótido, se diseñó un cebador de manera que el nucleótido 3’ terminal del cebador hibride con la cadena del molde de la PCR inmediatamente 3’ con respecto a cada nucleótido del SNP a ser analizado. Las reacciones de extensión del cebador de un único nucleótido se realizaron utilizando didesoxinucleótidos trifosfatos (ddNTP) marcados diferencialmente con fluorescencia. Los cebadores extendidos se resolvieron en un instrumento ABI 3730XL, los datos en bruto de la intensidad de fluorescencia se transfirieron a un ordenador receptor, y los genotipos fueron determinados en el ordenador receptormediante elsoftware GeneMapper.

Según se describe en detalle en el Ejemplo 3’, los genotipos observados dentro de cada sub-panel de muestras humanas fueron analizados en combinación para identificar un panel de SNP que juntos proporcionaron la máxima informatividad a través de cinco poblaciones de individuos, y a través de todas las cinco poblaciones humanas consideradas como una única población. Por ejemplo, si la combinación de dos o más SNP proporciona un aumento de la informatividad en relación a una combinación más pequeña de SNP, estos SNP no están en desequilibrio de ligamiento completo entre sí y pueden, por lo tanto, combinarse de manera eficaz para permitir una mejora de la informatividad para determinar el estado de la impronta del IGF2. Este análisis reveló un panel de 16 SNP que proporcionaron la máxima informatividad a través de todas las poblaciones. Este panel incluye 6 SNP no publicados anteriormente. La Tabla 1 detalla las coordenadas genómicas (NCBI build 36), variantes de secuencia de nucleótidos, y secuencias de nucleótidos circundantes de estos SNP no publicados anteriormente. Además, los paneles incluyen 10 SNP publicados anteriormente. La Tabla 2 detalla las coordinadas genómicas (NCBI build 36), variantes de secuencias de un único nucleótido, identificador de referencia de NCBI dbSNP y secuencias de nucleótidos circundantes de estos SNP identificados anteriormente. Según se describe en los Ejemplos más adelante, las combinaciones de SNP publicados anteriormente y no publicados anteriormente permiten un aumento en la informatividad total, lo que aumenta el número de pacientes que pueden ser monitorizados con éxito para la pérdida de impronta del IGF2 en relación a las combinaciones de SNP publicados anteriormente por sí solos, especialmente en los casos en que la población de pacientes incluye afroamericanos u otros con ascendencia de africanos negros.

Las frecuencias de heterocigosidad observadas para cada SNP (incluyendo tanto los SNP no publicados anteriormente como los identificados anteriormente), en el panel de todos los individuos genotipados para ese SNP (global), además de en los paneles afroamericano (AA), caucásico (CAU), chino (CHI), japonés (JPN) y de ascendencia mejicana (MEX) por separado, se detallan en la Tabla 3.

Ejemplo 2. Uso de uno cualquiera o más de los SNP nuevos para mejorar la detección de la LOI del gen IGF2.

Tal como se ha descrito anteriormente, la detección de LOI del gen IGF2 se basa en la comparación independiente de la cantidad de expresión obtenida de cada una de las dos copias del gen IGF2 aislado a partir de una muestra biológica de un individuo determinado. Normalmente, el gen IGF2 se imprime maternalmente (es decir, la copia heredada de la madre de un individuo habitualmente presenta represión a nivel transcripcional), mientras que la copiaheredada porvía paternadel gen se expresanormalmente. La LOItiene lugarcuando la improntamaterna del IGF2 es débil,dando comoresultado unosniveles de expresión similaresde las copiasdelgen heredadastanto por vía paterna como por vía materna. Un método para medir el estado de la impronta del IGF2 en una muestra es aislar, en primer lugar, el ADN genómico de una muestra biológica, y después determinar el genotipo o genotipos de uno o más sitios polimórficos en la región transcrita del gen IGF2. En segundo lugar, se mide a continuación la expresión específica de alelo del IGF2 utilizando uno o más nucleótidos heterocigotos en ARN que se extrae de la misma muestra biológica, o de una muestra biológica del mismo individuo. La expresión de cada una de las dos copias del gen del IGF2 puedemedirseindependientemente con un ensayo oensayosquesean cuantitativos,yque puedan diferenciar suficientemente entre los dos alelos de uno o más SNP heterocigotos dentro de la muestra. En tercer lugar, se calcula una relación de la cantidad de expresión de un alelo y la cantidad de expresión del otro alelo, yse compara de forma opcional conun valor de control yse ajusta de manera opcional, yse comparacon un valor umbral, determinando de ese modo el estado de impronta del gen IGF2 en la muestra.

Se describe aquí una aproximación específica deseada como un ejemplo de la utilidad de utilizar uno cualquiera o más de los SNP no publicados anteriormente descritos en la presente solicitud para determinar el estado de la impronta del IGF2 en una muestra de un paciente. Resulta evidente para los expertos en el arte que existen múltiples aproximaciones para la detección y cuantificación de los SNP, y puede utilizarse cualquiera de ellos tanto para el genotipado del ADN genómico de una muestra biológica para un SNP en particular, como para la cuantificación de niveles relativos de cada variante de secuencia presente en el ARNm expresado de una muestra biológica. Se perfila una estrategia básica en la Figura 2. Esta estrategia implica aislar tanto el ADN genómico como el ARN total (o ARN poliadenilado) de la misma muestra biológica o pares coincidentes de las muestras biológicas tomadas del mismo individuo (por ejemplo, sangre periférica, células mononucleares de sangre periférica, muestra de mucosa colónica, muestra de heces, etc.). La muestra de ADN genómico es genotipada a continuación con ensayos que detectan los alelos de uno o más SNP. Esta etapa determina qué SNP, si hubiera alguno, pueden utilizarse para el análisis de la expresión específica de alelo del gen IGF2 en la muestra de ARN coincidente. Si el individuo es homocigoto para todos los SNP evaluados mediante un ensayo, el individuo no es informativo para esos SNP y no puede medirse para valorar la LOI del IGF2. Si el individuo es heterocigoto (informativo) para uno o más SNP, se amplifica el ADNc de la región relevante del transcrito del IGF2 utilizando métodos estándar de transcriptasa inversa/ PCR (RT-PCR). La expresión de cada una de las dos copias del gen IGF2 se mide de forma independiente utilizando el ADNc generado con un ensayo que es cuantitativo, y que puede diferenciar suficientemente entre los dos alelos, y la comparación de esta relación con un valor umbral determina el estado de la impronta del gen IGF2. Si existen múltiples SNP heterocigotos para una muestra determinada, pueden utilizarse simultáneamente ensayos que diferencian cada uno de los SNP. Esto permite mediciones redundantes de la expresión específica de alelo dentro de una muestra, y la comparación de estas mediciones puede utilizarse para determinar un nuevo valor que representa la media o modo o valor de la mediana, y para determinar un coeficiente de varianza entre ensayos. Aunque puede utilizarse un rango de valores umbrales (de tal manera que la proporción del alelo menos abundante sea mayor que o igual a un 10%, 15%, 20%, 25% o 30% de la proporción cuantificada del alelo más abundante), habitualmente, se determina convencionalmente que una muestra determinada presenta LOI del IGF2 si la proporción cuantificada del alelo menos abundante es mayor que o igual al 33,3 % de la proporción cuantificada del alelo más abundante.

Un método para el genotipado de un individuo para un SNP determinado, se logra diseñando un cebador de oligonucleótidos que es complementario a la secuencia del gen IGF2 y que tiene un nucleótido 3’ terminal que es complementario al nucleótido del molde del IGF a una base 3’ del nucleótido polimórfico del molde. Pueden diseñarse ensayos para el genotipado de uno cualquiera o más de los SNP detallados en las Tablas 1 y 2. El cebador de oligonucleótidos se combina con y se hibrida con el producto del ADN amplificado por PCR de la muestra de ADN genómico en una mezcla que incluye todos los ddNTP (ddATP, ddCTP, ddGTP, ddTTP (o ddUTP)), cada uno etiquetado con una fracción fluorescente diferente, y se añade. Por ejemplo, si va a realizarse el genotipado de un polimorfismo G/A (y el nucleótido G/A está en la cadena molde de la muestra de ADN genómico), el cebador de oligonucleótidos se diseña para hibridar con el molde complementario con su nucleótido 3’ terminal hibridado con el nucleótido de molde complementario a una base 3’ de la posición G/A del molde. La extensión de cebador de un único nucleótido es catalizada mediante una ADN polimerasa en presencia de los ddNTP marcados con fluorescencia diferencialmente, de manera que los oligonucleótidos que se extienden por incorporación de ddCTP (que representan el alelo de G) o por incorporación de ddTTP (que representan el alelo A), se marcan con fluorescencia diferencialmente en sus extremos 3’ terminales. Los oligonucleótidos extendidos se resuelven después por electroforesis capilar y se analizan en presencia de un quinto estándar de tamaño marcado con colorante fluorescente. Se detectan los picos que representan productos de extensión de cebadores de un único nucleótido específicos y se cuantifican para determinar el genotipo para la muestra de ADN determinada. Puede realizarse el genotipado de múltiples SNP en una reacción formando multiplex con oligonucleótidos de diferentes longitudes diseñados para terminar justo en 3’ con respecto a diferentes sitios polimórficos. Se obtienen diferentes genotipos en base a i) la resolución de oligonucleótidos extendidos de diferente longitud y ii) el ddNTP específico etiquetado con fluorescencia incorporado durante una extensión de un único nucleótido.

Un método para determinar el estado de la impronta del IGF2 implica una aproximación con extensión de cebadores de un único nucleótido análogo que se diseña para diferenciar alelos diferentes de un SNP en particular. Los ensayos pueden diseñarse para utilizar uno cualquiera o más de los SNP detallados en las Tablas 1 y 2. Si se determina que un SNP dado es heterocigoto en una muestra de ADN genómico, se amplifica el ADNc de primera cadena de la muestra de ARN coincidente mediante una transcriptasa inversa (RT), utilizando cebadores hexaméricos o decaméricos aleatorios, cebadores oligodT complementarios a colas poliA de ARNm o un cebador complementario a una región específica del transcrito del IGF2. Los cebadores de oligonucleótidos complementarios a secuencias que flanquean el sitio del SNP se utilizan posteriormente para amplificar por PCR un producto del ADNc que incluye el sitio polimórfico. De forma alternativa, pueden utilizarse aproximaciones con PCR anidada para generar productos de ADNc. De forma alternativa, pueden utilizarse aproximaciones que incluyen la generación de un ARN antisentido a partir de ADNc mediante transcripción in vitro lineal, seguido de una segunda reacción de transcripción inversa que utiliza cebadores hexaméricos o decaméricos aleatorios o un cebador específico del transcrito del IGF2, y puede utilizarse amplificación por PCR posterior para generar productos de ADNc. Estos productos de RT-PCR se someten a ensayo a continuación para determinar las variantes de secuencia específicas del sitio polimórfico, utilizando el mismo o los mismos ensayos de extensión de cebadores de un único nucleótido descritos anteriormente. Se detectan y cuantifican los picos que representan productos específicos de extensión de cebadores de un único nucleótido. Se determina la relación de la cantidad cuantificada de un alelo y el otro alelo. Esta relación puede compararse con, y potencialmente ajustarse por, relaciones similares determinadas mediante una curva de control. La LOI se detecta si la proporción cuantificada del producto de PCR que representa el alelo menos abundante es mayor de o igual a 33,3 % de la proporción cuantificada del producto de PCR que representa el alelomásabundante.Según sehadescrito anteriormente,pueden utilizarse múltiplesSNP heterocigotospara medir la LOI en una reacción común, realizando multiplex con oligonucleótidos de diferentes longitudes diseñados para terminar justo en 3’ de diferentes sitios polimórficos, o con oligonucleótidos que incorporan diferentes ddNTP marcados o con su masa modificada en el cebador extendido.

Es posible para un individuo que está determinado a presentar una impronta normal del IGF2 expresar ambas copias del gen IGF2, siempre que la expresión de la copia expresada menos abundantemente del gen IGF2 esté por debajo de un umbral en particular en relación a la copia expresada más abundantemente del gen del IGF2. En este caso, puede utilizarse un ensayo cuantitativo que sea capaz de detectar el bajo nivel de la expresión del gen IGF2 de la copia impresa del gen, para determinar tanto el genotipo de un individuo para cualquier SNP como el estado de la impronta del IGF2 del individuo, realizando el ensayo únicamente en el ARN o ADNc amplificado a partir del ARN (es decir, que excluye la etapa de determinación del genotipo del individuo realizando el ensayo en productos de PCR amplificados a partir del ADN genómico). Por ejemplo, consideremos que la expresión normal de la copia materna impresa del gen IGF2 es 1/1000 el nivel de expresión de la copia paternal del gen IGF2. Podría utilizarse un ensayo cuantitativo capaz de la detección de, por ejemplo, 1 copia expresada maternalmente en presencia de

10.000 copias expresadas por vía paterna del gen IGF2 para determinar tanto el genotipo de un individuo en cualquiera de los SNP y el estado de la impronta del IGF2, siempre que el individuoseaheterocigoto para almenos uno de los SNP sometidos a ensayo. La detección de la expresión del gen IGF2 que incluye diferentes alelos de un SNP en particular, indicaría que el individuo es heterocigoto para ese SNP en particular. El nivel relativo cuantificado de la expresión de los dos alelos se compararía entonces para determinar el estado de la impronta del IGF2. Se determinaría que el individuo presenta LOI del IGF2 si la proporción cuantificada del alelo menos abundante es mayor que o igual a un porcentaje umbral de la proporción cuantificada del alelo más abundante.

Ejemplo 3. Demostración del uso de las combinaciones de SNP para una detección mejorada de la LOI del gen IGF2

La aplicación de un SNP en particular para la detección de LOI del IGF2 permite que se analice dicho SNP únicamente en aquellos individuos que sean heterocigotos (es decir, informativos). Por ejemplo, la Tabla 3 indica que los SNP más informativos a través de todo el grupo de individuos es el SNP representado por la SEQ ID NO: 8 (45,6% de los individuos fueron informativos para este SNP). Sin embargo, la aplicación de combinaciones de SNP individuales que no se encuentren en desequilibrio de ligamiento, daría como resultado una tasa más elevada de informatividad de la combinación en relación a un único SNP solo. Para identificar combinaciones de SNP que mejoran la informatividad para la detección de LOI del IGF2, se identificó la combinación de SNP que juntosproporcionan la máxima informatividad dentro de cada población étnica. Únicamente se incluyeron en el análisis las muestras que fueron genotipadas con éxito para todos los 16 SNP detalladas en las Tablas 1 y 2.74 de 96 muestras del panel afroamericano, 150 de 207 muestras del panel caucásico, 69 de 96 muestras del panel de ascendencia mejicana, 79 de 88 muestras del panel japonés y 71 de 84 muestras del panel chino fueron genotipadas con éxito para todos los 16 SNP. Tal como se muestra en la Fig. 3, las combinaciones de SNP aumentan espectacularmente la informatividad en relación a ese SNP en particular, lo que demuestra la carencia del desequilibrio de ligamiento completo entre los SNP detallados en las Tablas 1 y 2. Este resultado es sorprendente, dada la estrecha proximidad de cada uno de los 16 SNP entre sí, y múltiples informes publicados sugieren que la región está compuesta de unos pocos bloques de ligamiento y muestra, generalmente, desequilibrio de ligamiento. Además, un gran porcentaje de individuos analizados fueron informativos para 2 o más SNP entre la combinación de paneles de SNP (indicadas con barras negras y grises en la Fig. 3). Las combinaciones de los SNP para cada población étnica incluía los SNP representados por lasSEQ ID Nos: 1, 2, 3, 4, 12, 13, 15 y16 para el panel de muestras afroamericano;SEQ ID Nos: 5, 8, 9, 10, 12, 15 y 16 para el panel de muestras caucásico; SEQ ID Nos: 1, 7, 9, 10, 11, 12, 14, 15 y 16 para el panel de muestrasde ascendencia mejicana; SEQ IDNos:10,12,14y16 para el panelde muestras japonés; ylas SEQ ID Nos: 6, 8, 12 y16 para el panel de muestras chino.

Para identificar las combinaciones de SNP que proporcionan informatividad óptima a través de poblaciones en general, se calculó la informatividad global para todas las posibles combinaciones de SNP que incluyen al menos un SNP detallado en la Tabla 1 a lo largo de las muestras genotipadas para cada uno de los 16 SNP detallados en las Tablas 1 y 2. Para cada panel de un número de SNP en particular, múltiples combinaciones son capaces de proporcionar una informatividad similar. Por ejemplo, 4 diferentes combinaciones de 15 SNP proporcionan un80,59% de informatividad a lo largo de las muestras; 5 diferentes combinaciones de 14 SNP proporcionan un 80,36% de informatividad, 10 diferentes combinaciones de 13 SNP proporcionan de un 79,91% a un 80,14% de informatividad, y así sucesivamente. Para cada panel de un número de SNP en particular, se identificaron los SNP específicos que estaban presentes en cada panel óptimo posible, y se calculó la informatividad para cada una de estas combinaciones a lo largo de las muestras. La informatividad combinada para los paneles de 16, 12, 10, 9 y 4 SNP común a lospanelesde combinación óptima(Paneles A, B, C, DyE,respectivamente) se detallaen la Tabla4 y se representa en un gráfico en la Figura 4. Aunque la totalidad del panel de 16 SNP (Panel A) proporciona la informatividadmáselevadaengeneral yparacada grupoétnico específicamente,lossub-panelesproporcionan una informatividad observada similar. Las SEQ ID Nos que representan los SNP incluidos en cada uno de estos paneles se proporcionan en la Tabla 5. Como se muestra en la Figura 4, la informativiad observada de un panel de 10 SNP (Panel C) es tan solo ligeramente inferior a la combinación de 16 SNP (Panel A). La informatividad óptima a lo largo de las muestras que incluye los 10 SNP conocidos con antelación (Tabla 2), es del 76,98%, lo que indica que los SNP no publicados anteriormente descritos en la presente solicitud ofrecen mejoras en la informatividad.

Ejemplo 4. Demostración del uso de los SNP para determinar el estado de la LOI del IGF2.

El SNP correspondiente a la SEQ ID NO: 8 (rs680) se incluye dentro de las secuencias de reconocimiento diana de dos enzimas de restricción, Apa I y Ava II. Estas dos enzimas escinden en una forma específica de alelo. La Apa I reconoce y escinde la secuencia cuando está presente el alelo de “G”, y Ava II reconoce y escinde la secuencia cuando está presente el alelo de “A”. Para evaluar independientemente los genotipos dentro de un panel seleccionado de individuos, se amplificó un amplicón de PCR que incluía la posición de la SEQ ID NO: 8 a partir de una muestra de ADN genómico obtenida de cada individuo. Los amplicones fueron digeridos con Apa I o Ava II o una combinación de ambas enzimas. La digestión por parte de la Apa I únicamente indica que el individuo es homocigoto para el alelo de G, la digestión por parte de la Ava II únicamente indica que el individuo es homocigoto para el alelo deA, y la digestión porparte deambas enzimas indicaque el individuo es heterocigoto para el SNP. Se muestra un ejemplo del resultado de los datos para cada posible genotipo de la SEQ ID NO: 8 en la Figura 5.

Puede utilizarse la misma estrategia de ensayo básica para detectar la LOI del IFG2, siempre que el individuo que se somete ensayo sea heterocigoto para la SEQ ID NO: 8. Se mostró previamente que dos individuos tenían LOI para el IGF2 y se mostró previamente que el tercero presentaba una impronta del IGF2 normal. La región que incluía la SEQ ID NO: 8 fue amplificada por RT-PCR a partir de cada muestra. Se realizaron en paralelo reacciones sin transcriptasa inversa para confirmar que no había amplificación del ADN genómico. A continuación, los amplicones de RT-PCR fueron digeridos con Apa Io Ava II o una combinación de ambas enzimas, según se describe anteriormente. Los productos digeridos se resolvieron en un Bionalizador Agilent, y se determinaron las concentraciones de los fragmentos cortados y no cortados.La cantidad de fragmentos cortados por Apa I representa la proporción de ADNc amplificada a partir del alelo “G”. La cantidad de fragmentos cortados por Ava II representa la proporción de ADNc amplificada a partir del alelo “A”. Por lo tanto, la relación de los fragmentos cortados con Apa I y los fragmentos cortados con Ava II indica la relación relativa de la expresión de los dos alelos en la muestra de ARN original. Como se muestra en la Figura 6, la Muestra 2 expresa exclusivamente el alelo “A” y por lo tanto presenta una impronta del IGF2 normal. La muestra 1 expresa ambos alelos (es decir, presenta LOI del IGF2), con una relación G:A de 0,53 y por lo tanto presenta pérdida de impronta del IGF2. Lamuestra 3 expresa niveles detectables de ambos alelos, con una relación G:A de 0,27. Según se describe anteriormente, estudios previos han utilizado un umbral del 33,3 % de expresión del alelo menos abundante en relación al alelo más abundante, como la definición para la LOI del IGF2. Por lo tanto, utilizando un método basado en enzimas de restricción para determinar el estado de la LOI del IGF2, la muestra 3 describe una relación de alelos cercana al umbral habitual del 33,3% para determinar LOI del IGF2, y podría considerarse que representa una marca de límite para el estado de la LOI. Una limitación de una aproximación basada en enzimas de restricción para determinar el estado de la LOI del IGF2 es que, durante la amplificación por PCR del ADNc, las cadenas amplificadas que incluyen un alelo de un SNP heterocigoto pueden hibridar con cadenas complementarias amplificadas que incluyen el complemento del segundo alelo. Esto da como resultado una molécula en forma de heterodúplex con bases con errores de apareamiento en la posición del SNP. Estas moléculas no son reconocidas y ni digeridas por ninguna de las dos enzimas de restricción, lo que da como resultado un ADN no cortado. Como resultado, la relación calculada de alelos puede no ser absolutamente precisa. Tal como se describe más adelante, el uso de métodos que no implican la digestión con enzimas de restricción puede superar las cuestiones introducidas por la formación de un heterodúplex del producto de la PCR.

Otros SNP que pueden ser útiles para detectar LOI del IGF2 no se incluyen dentro de las secuencias de reconocimiento de las enzimas de restricción. Por lo tanto, la capacidad para monitorizar la LOI en un individuo determinado se ve mejorada desarrollando ensayos de expresión de genes específicos de alelos que no requieren digestión con enzimas de restricción. Como demostración, se desarrolló un ensayo basado en extensión de cebadores para la SEQ ID NO: 8. La Figura 7 representa un diagrama del uso de un ensayo de extensión de cebadores para el genotipado de la SEQ ID NO: 8. La región (SEQ ID NO:25) que incluye el SNP de interés se amplifica por PCR utilizando el ADN genómico obtenido del individuo al que se va a realizar el genotipado. Se añade un cebador (SEQ ID NO:24) al producto de PCR purificado que hibrida con su nucleótido 3’ terminal, complementario al nucleótido delmolde, 1 base con el extremo 3’ del nucleótido polimórfico que va a ser genotipado. Se lleva a cabo extensión de cebadores de un único nucleótido utilizando una ADN polimerasa termoestable y ddNTP marcados con fluorescencia diferencialmente. En el ejemplo representado con un diagrama en la Figura 7, se añaden o bien ddGTP marcado con dR110 o ddATP marcado con dR6G al extremo 3’ del cebador (SEQ ID Nos: 25 y 26). Estos polinucleótidos marcados se resuelven después y se cuantifican mediante electroforesis capilar en gel e imagen fluorescente. Se calculan las áreas de pico representativas de cada posible nucleótido incorporado (es decir, utilizando un Analizador Génico ABI 3730 con software Gene Mapper). Las áreas de pico se comparan para determinar el genotipo del individuo en esa posición del SNP.

Los tres individuos que se sometieron a ensayo para determinar LOI del IGF2 mediante el ensayo basado en enzimas de restricción (Figura 6) se genotiparon para caracterizar la SEQ ID NO: 8 utilizando el ensayo de extensión de cebadores (Figura 8). Tal como era de esperar, se detectaron picos que representaban ambos alelos del SNP, confirmando que los tres individuos son heterocigotos para la SEQ ID Nº: 8.

Para medir la expresión específica de alelos del IGF2 en los mismos tres individuos, la región que incluye la SEQ ID NO: 8 se amplificó por RT-PCR a partir de una muestra de ARN total obtenida de cada individuo. Se realizaron reacciones que carecían de transcriptasa inversa para confirmar que no había amplificación del ADN genómico. Los productos del ADNc obtenidos fueron purificados y analizados con la extensión de cebador de un único nucleótido, tal comoserepresentaenundiagrama en la Figura7.Se calcularonlasáreasde picoque representancada uno de los dos posibles alelos. Para corregir las diferencias en las intensidades del colorante, estos valores se normalizaron en base a comparaciones de áreas de pico calculadas utilizando relaciones 1:1 predeterminadas de cada alelo (es decir, una relación 1:1 de amplicones de ADN obtenidos de individuos que son homocigotos para cada uno de los dos alelos). Los cromatogramas resultantes y las relaciones de alelos calculadas se muestran en la Figura 9. De acuerdo con los resultados mostrados en la Figura 6, se determinó que las muestras 1 y 3 mostraban LOI del IGF2, y se determinó que la muestra 2 mostraba impronta normal del IGF2. Resulta evidente que podría utilizarse el mismo tipo de ensayo de extensión de cebadores de un único nucleótido que utiliza cualquier SNP dentro de la región transcrita del IGF2 para monitorizarla expresión específica de alelo del IGF2 (ver las Figuras 10 y 11).

Para demostrar el uso de SNP adicionales para medir la expresión específica de alelo del IGF2, se diseñaron ensayos de extensión de cebadores de un único nucleótido en base a 12 SNP adicionales (SEQ ID NOs: 2, 3, 4, 5, 6, 7, 9, 10, 11, 14, 15 y 16). Para cada uno de los 13 SNP (que incluyen la SEQ ID NO: 8), los productos de la PCR se amplificaron por separado a partir de muestras de ADN genómico obtenidas de dos individuos; uno homocigoto para un alelo del SNP y el otro homocigoto para el otro alelo del SNP. Los productos de la PCR se purificaron y cuantificaron. Para cada uno de los 13 SNP, se combinaron dos productos de la PCR (uno amplificado a partir de la muestra de ADN homocigota para un alelo, y el otro amplificado a partir de la muestra de ADN homocigota para el otro alelo) en las siguientes relaciones del alelo 1 con respecto al alelo 2; 1:10, 1:6, 1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1, 6:1, y 10:1. Para cada uno de los nueve SNP, se realizó el ensayo de extensión de cebadores de un único nucleótido por triplicado en cada punto de dilución. Se calcularon las áreas de pico que representan cada uno de los dos posibles alelos. Para corregir las diferencias en las intensidades del colorante, estos valores se normalizaron en base a las comparaciones de las áreas de pico calculadas, utilizando relaciones 1:1 predeterminadas de cada alelo. La linealidad cuantitativa analítica de cada ensayo se muestra en la Figura 10 y Figura 11. La R2 y el gradiente para cada ensayo se muestran en la Tabla 6.

Los ensayos de extensión de cebadores de un único nucleótido pueden ser utilizados en un formato multiplex, de manera que una combinación de SN sea genotipado (o de forma alternativa, de manera que una combinación de SNP se utilice para medir la expresión alélica en el ARN o en el ADNc), en un único ensayo. Cada SNP que se observa que es informativo en un individuo determinado, puede ser entonces utilizado para determinar el estado de la impronta del IGF2 de ese individuo. Los ensayos pueden combinarse en un panel de ensayo multiplex utilizando cebadores que migren diferencialmente durante la electroforesis capilar o que tengan masas únicas y puedan ser cuantificadosdiferencialmentemedianteespectrometría de masas,porejemplo.LaFigura 12A muestra elresultado de un ensayo de genotipado multiplex realizado sobre ADN genómico que fue extraído de una muestra de sangre de un individuo. El ensayo determina los genotipos y determina el estado de la impronta en las posiciones del SNP representadas por las SEQ ID Nos: 1, 2, 3, 7, 8, 10, 11, 12, 15 y 16. Los ensayos de extensión de cebadores de un único nucleótido pueden ser designados para determinar la secuencia de un único nucleótido en cualquiera de las dos cadenas (o de las dos o más opciones alélicas) en la posición del SNP. Ha de señalarse que los nucleótidos indicados en la Figura 12A y 12B y en la Tabla 7 son complementarios a las secuencias indicadas en la Tabla 1 y Tabla 2 para los SNP representados por las SEQ ID Nos: 2, 3, 7 y 11 ya que el ensayo de extensión de cebadores monitoriza la cadena opuesta, como la representada en la Tabla 1 y Tabla 2. Según se muestra en la Figura 12A y en laTabla7, la muestra A es homocigota en los SNP representados por lasSEQ IDNos: 1, 2, 7, 8, 10, 15 y16.Sin embargo, la misma muestra es heterocigota (y por lo tanto, informativa) en los SNP representados por las SEQ ID Nos: 3, 11 y 12. Debería señalarse que mientras todos los tres SNP heterocigotos fueron utilizados en el presente ejemplo, cualquiera de estos tres SNP heterocigotos, o cualquier combinación de dos de estos SNP, puede ahora utilizarse para determinar el estado de la impronta del IGF2 en este individuo. La Figura 12B muestra el resultado del mismo panel de ensayo multiplex cuando se utiliza para detectar la expresión específica de alelo del IGF2 en el ADNc generado a partir del ARN total obtenido de la misma muestra de sangre. Tal como se muestra en la Figura 12Ay en laTabla 7,la muestra A presenta una expresión impresa normal del IGF2.Es decir, la expresión se obtiene a partir de una única copia del gen IGF2. El alelo expresado incluye una T en la posición del SNP representada por la SEQ ID NO: 3, una G en la posición representada por la SEQ ID NO: 11 y una C en la posición del SNP representada por la SEQ ID NO: 12. No se detecta la copia del gen IGF2 que contiene una G en la posición del SNP representada por la SEQ ID NO: 3, una A en la posición representada por la SEQ ID NO: 11 y una T en la posición representadaporlaSEQ IDNO: 12.La Tabla7muestralosresultadosdelmismo ensayo multiplexrealizado en una segunda muestra (Muestra B). Esta muestra es heterocigota (y por lo tanto, informativa) en el SNP representado por la SEQ ID NO: 16. La muestra B presenta una expresión impresa de forma habitual del IGF2. El alelo expresado incluye una G en la posición del SNP representado por la SEQ ID NO: 16. La copia del gen IGF2 que contiene el alelo de A no se detecta.

Las mismas dos muestras que se presentan en la Figura 12 (Muestra A y Muestra B) fueron analizadas utilizando ensayos uniplex para los SPN representados por las SEQ ID Nos: 4, 5, 6, 9, 13 y 14 para determinar los genotipos en estas posiciones del SNP y para determinar el estado de la impronta en base a estos SNP (Tabla 7). La Muestra A es homocigota en las posiciones del SNP representadas por las SEQ ID Nos: 4, 5, 6, 9, 13 y 14. La Muestra B es homocigota en la posición representada por las SEQ ID Nos: 4, 6, 9, 13 y 14. Sin embargo, la Muestra B es heterocigota (informativa) en la posición del SNP representada por la SEQ ID NO: 5. El análisis de la expresión específica de alelo del IGF2 detectó tanto los alelos G como A de la SEQ ID NO:5 (Tabla 7).

La Tabla 8 detalla los valores obtenidos para cada pico detectado en el experimento descrito anteriormente (Muestra A y Muestra B, analizada para todos los 16 SNP). A continuación de la electroforesis capilar de las reacciones de extensión de cebadores de un único nucleótido y la medición de las intensidades de fluorescencia utilizando un Analizador Genético ABI 3730XL, se calcularon las áreas de pico mediante un programa de ordenador (GeneMapper). Los valores se recibieron en un ordenador principal. Los valores del área de picos representaron la presencia o ausencia de cada opción polimórfica en cada una de las posiciones de los 16 SNP obtenidos del ensayo de los productos de la PCR amplificados a partir del ADN genómico (área de picos 1 del ADN genómico y área de picos 2 del ADN genómico en la Tabla 8). Un programa de ordenador correlacionó la presencia o ausencia de las áreas de picos detectadas con una determinación del genotipo en cada posición del SNP. Por ejemplo, la Muestra A es homocigota (T/T) en la posición del SNP representada por al SEQ ID NO: 1 ya que un pico se detectó para el alelo de T (área de picos 1), pero no el alelo de G (área de picos 2). Además, la Muestra A es heterocigota (C/T) en la posición del SNPrepresentadaporla SEQ IDNO: 12porque se detectó un pico para el alelo de C (área de picos 1 = 54813) y para el alelo de T (área de picos 2 = 163646). Los genotipos en cada posición del SNP y en ambas muestras se determinaron de forma similar. Un método implementado por ordenador se utilizó para mostrar estos resultados, como se muestra en la Tabla7.

Para calcular las relaciones que representan la abundancia de los alelos detectados, es necesario normalizar las diferencias en las intensidades de la etiqueta de fluorescencia entre los diferentes ddNTP marcados utilizados para la reacción de extensión de cebadores de un único nucleótido. Para la posición de un SNP determinado, la relación de la presencia de dos alelos en el ADN genómico extraído de un individuo diploide que es heterocigoto para ese SNP, es de 1:1. Por lo tanto, se utilizó un método implementado por ordenador para normalizar las diferencias en las intensidades de fluorescencia. Por ejemplo, el área de picos calculada para el alelo de G del SNP representado por la SEQ ID NO: 5 en la Muestra B (16043) se dividió por el área de picos calculada para el alelo de A del SNP representado por la SEQ ID NO: 5 en la Muestra B (12107) para obtener la relación Alelo 1:Alelo 2 de 1,3251. Se calculó un factor de normalización (Tabla 8) de manera que la relación de los dos alelos se reajusta para representar los efectos del colorante hasta 1,0 (1/1,3251 = 0,7547). Los factores de normalización pueden además ser determinados utilizando mezclas estándar.

Para determinar un valor que representa el estado de la impronta del IGF2, los valores del área de picos representaron la presencia o ausencia de cada opción polimórfica en cada una de las posiciones de los 16 SNP obtenidos del ensayo de los productos de la PCR amplificados a partir de ADNc (área de picos 1 del ARN y área de picos 2 del ARN en la Tabla 8). Los valores se recibieron en un ordenador central, y se utilizó un método implementado por ordenador para comparar áreas de picos detectadas para cada posible alelo. Por ejemplo, se determina que la Muestra A es informativa para los SNP representados por las SEQ ID Nos: 3, 11 y 12. Se determina que el individuo presenta una impronta del IGF2 normal ya que, en cada una de las tres posiciones del SNP, se detectó un área de picos únicamente para solo uno de los dos posibles alelos. Se determina que la Muestra B es informativa para el SNP representado por las SEQ ID Nos: 5 y 16. Se detectó un área de picos para solo uno de los posibles alelos para el SNP representado por la SEQ ID NO: 12. Sin embargo, se detectó un área de picos para ambos de los dos posibles alelos para el SNP representado por al SEQ ID NO: 5 (área de picos 1 del ARN = 6283 y área de picos 2 del ARN = 14115 en la Tabla 8). Se utilizó un método implementado por ordenador para calcular una relación normalizada del Alelo 1 con respecto al Alelo 2 ((área de picos 1 del ARN (6283)/área de picos 2 del ARN (14115)) * Factor de normalización (0,7541) = Relación normalizada (0,3359)). Se determina que el individuo presenta un estado de impronta del IGF2 en la marca de límite, ya que un SNP informativo indicó la detección de solamente uno de los dos alelos posibles (SEQ ID NO: 12) y un SNP diferente indicó la detección de ambos alelos en una relación muy cercana al umbral para determinar impronta vs. pérdida de impronta. Se utilizó un método implementado por ordenador para mostrar estos resultados,según se muestra en la Tabla 8.

Tal como se describe anteriormente, el análisis de más de un SNP heterocigoto en un individuo determinado (heterocigotos compuestos) proporciona un método para determinar múltiples mediciones independientes del estado de la impronta para un individuo, permitiendo de ese modo cálculos de valores adicionales que incluyen, pero no se limitan a, i) el valor de media de las áreas de picos calculadas, relaciones de área de picos del genotipo, factores de normalización, relaciones de área de picos de la expresión específica de alelos y relaciones normalizadas de la expresión específica de alelos, ii) la desviación estándar entre las áreas de picos calculadas, relaciones del área de picos del genotipo, factores de normalización, relaciones del área de picos específica de alelos y relaciones de expresión específica de alelos normalizada, iii) el modo de las áreas de picos calculadas, relaciones del área de picos del genotipo, factores de normalización, relaciones del área de picos de la expresión específica de alelos y relaciones de la expresión específica de alelos normalizadas, y iv) coeficientes de variación para las áreas de picos calculadas, relaciones del área de picos del genotipo, factores de normalización, relaciones del área de picos específica de alelos y relaciones del área de picos específica de alelos normalizadas. Aplicar estos métodos puede permitir una única determinación más precisa del estado de la impronta para un determinado individuo. Por ejemplo, consideremos un individuo que es heterocigoto para tres SNP (SNP1, SNP2, SNP3) en un panel, y el análisis del estado de la impronta que se obtiene como resultado en la detección de picos que representan ambos alelos de cada SNP. Si el área de picos 1 (alelo 1) calculada fue 153330 (SNP1), 136263 (SNP2) y 147544 (SNP3), y el área de picos 2 (alelo 2) calculada fue 124589 (SNP1), 132581 (SNP2) y 126598 (SNP3). Si el factor de normalización para estas áreas de picos es 0,778 (SNP1), 0,897 (SNP2) y 1,258 (SNP3), entonces las relaciones normalizadas son 0,9575 (SNP2), 0,9219 (SNP2) y 1,4661 (SNP3). La relación media de la expresión específica de alelos es 1,115, la mediana de la relación de la expresión específica de alelos es 0,9574, la desviación estándar entre las relaciones de la expresión específica de alelos es 0,3045, y el coeficiente de variación de las relaciones de la expresión específica de alelos es 0,273. Se debe señalar que pueden utilizarse múltiples algoritmos diferentes para la comparación de los valores obtenidos de los ensayos con SNP heterocigotos compuestos, para calcular un valor preciso que se correlaciona con el estado de la impronta del IGF2.

Ejemplo 5. Desarrollo de un par de ácidos nucleicos sintéticos, útiles para controlar ensayos de expresión específica de alelos y de genotipo, que miden los SNP dentro del exón 9 del gen IGF2.

Se designó un par de ácidos nucleicos sintéticos de control, que fueron modificados por ingeniería genética para proporcionar un control ampliamente mejorado para los ensayos de genotipado y de impronta para el IGF2. Cuatro objetivos influenciaron el diseño.

En primer lugar, los dos miembros de ácido nucleico del par ("Synth1"; SEQ ID NO:21), y ("Synth 2"; SEQ ID NO:23) se diseñaron para contener una parte del extremo 3’ de la secuencia del exón 8 del IGF2 y una parte importante de la secuencia del exón 9 del IGF2 (una región rica en repeticiones CA que tiene lugar de forma natural en el exón 9 del IGF2 humano fue omitida de la secuencia de control). El extremo 3’ del exón 8 y una parte importante de la secuencia del exón 9 del IGF2 se incluyeron en el diseño de los controles para permitir que los polinucleótidos utilizados en los ensayos de genotipado y de impronta para el IGF2 (que incluyen cebadores de transcriptasa inversa, cebadores de PCR, y cebadores o sondas de SNP que están diseñados para hibridar específicamente con la parte transcrita del IGF2 en las muestras clínicas), hibriden con los miembros de ácido nucleico del control y con los transcritos del IGF2 demuestrasclínicas con igualeficacia.Adicionalmente,laregión rica en repeticiones CAfue omitida del diseño del par de ácidos nucleicos de control debido al hecho de que ese tipo de región semi-repetitiva puede ser difícil de sintetizar in vitro, puede ser inestable cuando se clone en bacterias, y puede introducir dificultades para la amplificación por PCR en el posterior uso del control.

En segundo lugar, los miembros de ácido nucleico del par (Synth1 y Synth2) se diseñaron para ser idénticos en su secuencia, con la excepción de la opción polimórfica diseñada en cada miembro de control en cada una de las posiciones de los 16 SNP. El Synth1 fue diseñado para contener una opción polimórfica de cada uno de los 16 SNP, mientras que el Synth2 fue diseñado para contener la otra opción polimórfica de cada uno de los 16 SNP. Para los propósitos de este ejemplo en el desarrollo del control, los miembros de ácido nucleico del par fueron diseñados para ser idénticos en todas las posiciones de las bases, excepto para las posiciones de los 16 SNP para evitar la potencial introducción inadvertida de una amplificación específica de secuencia o un sesgo de la detección de un miembro del par de control en relación al otro, o entre un miembro del par de control y una medición de ensayo de una muestra clínica.

En tercer lugar, la secuencia del extremo 3’ del exón 8 del IGF2 seguida de la secuencia en el extremo 5’ del exón 9 del IGF2, (es decir, que contiene la unión de corte y empalme del exón 8-9), fue incluida en el diseño del extremo 5’ de cada uno de SYNTH1 ySYNTH2 (Figura 13 A).El uso de los polinucleótidosquesolapan lasuniones decorte y empalme del exón en los ensayos de impronta que miden las muestras clínicas, pueden reducir de forma significativa la posibilidad de que el ensayo de impronta amplifique de forma inadvertida ADN genómico contaminante en el ARN extraído de las muestras de pacientes durante la etapa de amplificación por RT-PCR. Incluyendo la región 3’ del exón 8, omitiendo el intrón entre el exón 8 y 9, e incluyendo la región 5’ del exón 9 en el diseño del extremo 5’ de la secuencia de Synth1 y Synth2, cualquier polinucleótido de extensión del exón 8-9 utilizado en un ensayo de impronta del IGF2 probablemente hibridará con el par de ácidos nucleicos en el control de una manera tan eficiente como lo harán con los transcritos del IGF2 en muestras clínicas.

En cuarto lugar, una secuencia del promotor T7 se incluyó en el extremo 5’ con respecto al comienzo de la secuencia del exón 8, para permitir la transcripción in vitro del ARN que incluye las secuencias del exón 8-9 modificadas genéticamente, y las secuencias que incluyen los sitios de la enzima de restricción Not I para la clonación fueron incluidas en cada extremo de las secuencias de Synth1 y Synth2 (Figura 13 B), para permitir una introducción conveniente en los vectores plasmídicos.

Una vez que la síntesis del par de ácidos nucleicos se completó, el diseño de Synth1 y Synth2 fue confirmado mediante análisis de la secuenciade ADN.Lasecuenciade ADNde Synth1 está indicadacomo SEQIDNO:21.La secuencia de Synth2 está indicada como SEQ ID 20. La localización de las posiciones de los 16 SNP y la opción polimórfica presente en cada uno de Synth1 y Synth2 se proporciona en la Tabla 9, y las posiciones del SNP para cada uno de los 16 SNP diseñados en Synth1 y Synth2 están indicados como SEQ ID Nos:1-16. La secuencia completa del exón 9 del IGF2 se proporciona como SEQ ID NO:20, una secuencia que corresponde exactamente al registro del Ensemble del exón ENSE00001488587 (Human GRCh37, Febrero 2009). La región rica en CA semirepetitiva yde longitudpolimórfica,que fue omitidadelos ácidosnucleicos de control sintetizados según se describe anteriormente, se proporciona en la SEQ ID NO:22, y está localizada entre las posiciones 1115 y 1692 de la SEQ ID NO:20, la secuencia nativa del exón 9 del IGF2. La región omitida rica en repeticiones CA está inmediatamente flanqueada por las posiciones 1168 y 1169 de la SEQ ID NO:21 y SEQ ID NO:23. Esta región de la secuencia omitida no incluye ninguna de las posiciones de los 16 SNP detallados en la SEQ ID 1-16. La secuencia obtenida del exón 8 está localizada entre las posiciones 34 y 54 de las SEQ IDs Nos. 21 y 23. Las secuencias del promotor T7 están localizadas entre las posiciones 11 y30 de las SEQ IDs 21 y23.

Una vez se confirmaron Synth1 y Synth2 mediante secuenciación de ADN, los fragmentos fueron digeridos por separado con Not I y ligados en el sitio de clonación de Not I del vector pEZ, produciendo dos plásmidos independientes; pEZ-Synth1 y pEZ-Synth2. Estos plásmidos se transformaron individualmente en la cepa DH5 α de la E. coli.

Un modo de realización de la invención utiliza los miembros de ácido nucleico del control en mezclas de Synth1 y Synth2 en relaciones cuantitativas conocidas y utilizando estas mezclas como molde en un ensayo diseñado para monitorizar la expresión específica de alelos del IGF2. Por lo tanto, se diseñó una estrategia para confirmar que la cuantificación de las moléculas de control es precisa, de manera que los resultados de los ensayos de las muestras clínicas delestado desconocido de la impronta puedan sercomparadosconresultadosestándardecontrol precisos. La estrategia para el ensayo diseñado para monitorizar la expresión específica de alelo del IGF2, y el uso de los ácidos nucleicos de control en este ensayo, se muestra en un diagrama en la Figura 13. La Figura 13A muestra un diagrama del gen IGF2. Diversos promotores potenciales para el IGF2 están indicados por flechas marcadas con Promotor 1, P0, P2, P3 o P4. Los potenciales exones transcritos están indicados por flechas de bloque conectadas por una línea de puntos que representa las regiones de secuencia intrónica. Las regiones de secuencia exónica no traducidas están indicadas mediante flechas de bloque rellenas, y las regiones de secuencia exónica traducidas están indicadas mediante flechas de bloque huecas. La barra de escala en la parte superior de la Figura 13A se muestra en incrementos de 1000 pares de base (Kb). Se muestra una vista aumentada de la región de ácido nucleico de Synth1 (o Synth2) en la Figura 13B. La barra de escala se muestra en incrementos de 500 pares de bases. La secuencia de ácido nucleico de Synth1 (o Synth2) incluye los 21 pares de bases más 3’ del exón 8, seguido inmediatamente por la secuencia del exón 9 (es decir, la secuencia intrónica entre los exones 8 y 9 está omitida, según se representa eneldiagramade la Figura13 A).Los extremos5’ y3’de Synth1 (o Synth2)incluyen las secuencias de reconocimiento de la enzima de restricción Not I que fueron incluidas para permitir el ligamiento de las secuencias en un vector de transcripción. La región de la secuencia rica en repeticiones CA presente en el exón 9 del IGF2 fue omitida de la secuencia de Synth1 (o Synth2),según se indica en la Figura13B.

Para generar ADNc a partir de ARNm del IGF2 endógeno o a partir de ARN transcrito in vitro obtenido de ARN de los plásmidos pEZ-Synth1 o pEZ-Synth2, cuatro cebadores se utilizan para generar un ADNc de primera cadena mediante transcriptasa inversa. Estas reacciones pueden estar realizadas como cuatro reacciones separadas para cada cebador, u opcionalmente, como una reacción multiplex que incluye los cuatro cebadores. Los sitios de hibridación de estos cuatro cebadores dentro de la región Synth1 (o Synth2) (o de manera opcional, dentro de la región de ARNm del IGF2) están indicados mediante puntas de flechas en la Figura 13B (cebadores de RT). Las moléculas de ADNc de primera cadena generadas por esta reacción RT están indicadas mediante líneas de puntos en la Figura 13C.

A continuación de la transcripción inversa, los ADNc de primera cadena se utilizan como molde para la amplificación por PCR de primera ronda de cuatro amplicones independientes. Los sitios de hibridación de los cuatro pares de cebadores en relación al ADNc de primera cadena generado están indicados por puntas de flechas en la Figura 13D. Las líneas continuas que conectan los pares de cebadores representan el amplicón de PCR producido en cada reacción de amplificación de PCR de primera ronda. Estas reacciones pueden ser realizadas como cuatro reacciones separadas para cada parde cebadores,o de manera opcional,comouna reacciónmultiplexque incluye todos los cuatro pares de cebadores. Debe señalarse que el cebador indicado mediante el recuadro hueco en la Figura 13 D incluye la secuencia de expansión de la unión de corte y empalme del exón 8-9.

A continuación, los amplicones producidos en la amplificación por PCR de primera ronda se utilizan como molde para la amplificación de cuatro amplicones anidados independientes. Los sitios de hibridación de los cuatro pares de cebadores en relación al ADNc de primera cadena generado, están indicados mediante puntas de flecha en la Figura 13E. Las líneas continuas que conectan los pares de cebadores representan el amplicón de la PCR producido en cada reacción de amplificación de PCR de segunda ronda. Estas reacciones pueden estar realizadas como cuatro reacciones separadas para cada par de cebadores, o de manera opcional, como una reacción multiplex que incluye todos los cuatro pares de cebadores.

Cada uno de los cuatro amplicones generados por la reacción de PCR de segunda ronda incluye una o más de las posiciones del SNP representadas por las SEQ ID NOs: 1-16. La posición de cada SNP está indicada por un rombo en la Figura 13F. Los amplicones generados por esta reacción de PCR pueden ser utilizados para cuantificar la cantidad de cada opción polimórfica de cada posición del SNP presente. Para una muestra de ARN obtenida de un individuo que es heterocigoto para uno o más SNP, cuantificar la cantidad de un amplicón generado que incluye una opción polimórfica del SNP en relación a la cantidad de un amplicón generado que incluye la otra opción polifórmica del SNP, permite la determinación de la cantidad de expresión de un alelo del IGF2 dentro de la muestra obtenida de ese individuo.

Para confirmar la precisión de la cuantificación lograda con los controles, el nucleótido en cada posición del SNP representada por las SEQ ID Nos: 1-16 en pEZ-Synth1 y pEZ-Synth2 se midió utilizando un ensayo multiplex de extensión de cebadores de un único nucleótido. Se diseñaron dieciséis cebadores que hibridaron de talmanera que el extremo 3’ de cada cebador hibridó una posición de base con el extremo 5’ de cada posición del SNP. Las reacciones de extensión de cebadores de un único nucleótido fueron realizadas en presencia de ddNTP marcados con fluorescencia diferencialmente (por ejemplo, ver https://products.appliedbiosystems.com/ab/en/US/adirect/ab?cmd=catNavigate2&catID=60 0762&tab=DetailInfo; o Biotechniques. 2001 Dec;31(6):1374-80). La resolución de cebadores extendidos de un único nucleótido fue realizadamedianteelectroforesiscapilar(ABI3730XL),yse calcularon las áreas de picosutilizando un software ABI GeneMapper.Los resultadosse muestran en la Tabla10.

Estos resultados confirmaron que el ensayo de extensión de cebadores de un único nucleótido basado en SNP recapituló los genotipos identificados mediante secuenciación de ADN para cada posición del SNP en cada ácido nucleico de control. Además, estos resultados demostraron que los ácidos nucleicos de control pueden ser utilizados como controles positivos para cualquier tipo de ensayo de genotipado que determine el nucleótido presente en estas posiciones de los 16 SNP. Por ejemplo, pEZ-Synth1 (o moléculas obtenidas a partir de pEZ-Synth1, tal como mediante la digestión con una enzima de restricción o mediante amplificación por PCR) puede servir como control positivo para los resultados de ensayos de genotipado que son de esperar en un individuo homocigoto para cualquiera de los alelos incluidos en el constructo Synth1. De igual manera, el pEZ-Synth2 (o moléculas obtenidas a partir del pEZ-Synth2, tal como mediante digestión con una enzima de restricción o mediante amplificación por PCR) puede servir como control positivo para los resultaos de ensayos de genotipado que son de esperar para un individuo homocigoto para cualquiera de los alelos incluidos en el constructo Synth2. Finalmente, una mezcla que contiene cantidades iguales de pEZSynth1 y pEZ-Synth2 (o cantidades iguales de moléculas obtenidas a partir de pEZ-Synth1 y pEZ-Synth2,puede servir como control positivo para los resultados de ensayos de genotipado para un individuo heterocigoto para cualquiera de los 16 SNP.

Ejemplo 6. Uso de controles de ADN para determinar la linealidad cuantitativa de un ensayo monitorizando la abundancia relativa de diferentes alelos.

Los plásmidos pEZ-Synth1 y pEZ-Synth2 fueron cuantificados mediante Nanodrop, y la concentración de cada plásmido purificado se normalizó a 1 ng/µL. Las mezclas de pEZ-Synth1 y pEZ-Synth2 se realizaron en las siguientes relaciones: 8:1, 6:1, 4:1, 3:1, 2:1, 1:1, 1:2, 1:3, 1:4, 1:6 y 1:8 (Synth1:Synth2). Cuatro amplicones de PCR que no solapan fueron designados para amplificar las regiones transcritas del exón 9 del IGF2 que incluyen los nucleótidos delos 16SNP,según se muestra en la Figura13E.Para cada puntode la relación,seutilizó 1 ngde la mezcla del plásmido como molde para la amplificación porPCR de los cuatro amplicones. Los amplicones obtenidos a partir de las mezclas de la relación Synth1/Synth2 fueron purificados individualmente en columnas de centrifugación para purificación de la PCR (Qiagen), y se utilizaron como molde para el ensayo multiplex de extensión de cebadores de un único nucleótido descrito en el Ejemplo 5. Los ensayos fueron realizados por triplicado, y se calcularon las áreas de picos de media para cada pico. Los resultados se muestran en la Figura 14. La relación de entrada conocida del molde Synth1:Synth2 se representó en el eje X. Para cada ensayo de extensión de cebadores de un único nucleótido basado en SNP dentro del ensayo multiplex, la relación media medida de las áreas de picos que representan la relación alelo de Synth 1: alelo de Synth2 se representó en el eje Y. Las barras de error indican más / menos una desviación estándar a lo largo de las mediciones triplicadas. Todos los valores de los puntos de datos de media se multiplicaronporun factor de normalizacióncomún que ajustaelvalor medido para el punto de datos de entrada 1:1 conocido para que sea exactamente igual a 1,0. Los datos se representaron en una escala logarítmica para visualizar uniformemente todos los puntos de datos a lo largo de la serie de relaciones. Se muestran los datos obtenidos de un ensayo basado en SNP que utiliza una posición de SNP dentro de cada uno de los cuatro amplicones. Estos incluyen los ensayos que utilizan los SNP representados por la SEQ ID NO: 7 dentro del Amplicón 1 (Figura 14 A), SEQ ID NO: 5 dentro del Amplicón 2 (Figura 14 B), SEQ ID NO: 1 dentro del Amplicón 3 (Figura 14 C)ySEQ ID NO: 13 dentro del Amplicón 4 (Figura 14 D).

Estos datos demuestran que el ensayo fue cuantitativo y reproducible en este rango, y que el par de mezclas de ácido nucleico de control proporcionó, en una única dilución en serie, un conjunto de datos de curva estándar suficientes para controlar todos los componentes del ensayo requeridos para detectar todos los SNP. El presente ejemplo demuestra por tanto cómo las mediciones del ensayo de la curva estándar de las mezclas pueden ejecutarse junto con las muestras clínicas, de tal manera que las mediciones de ensayo de las muestras con relaciones de alelos desconocidas pueden ser extrapoladas contra esta curva para determinar la abundancia relativa de las moléculas que contienen los dos alelos.

Ejemplo 7. Uso de controles de ARN para determinar la linealidad cuantitativa de un ensayo monitorizando la abundancia relativa de diferentes alelos.

Debido a que ambos ácidos nucleicos de control incluyen un promotor T7 aguas arriba de la región de secuencia de la unión de los exones 8-9 del IGF2, pueden generarse moléculas de ARN análogas al ARNm del IGF2 mediante transcripción in vitro (IVT). Cada uno de los ácidos nucleicos de control fueron suprimidos del pEZ-Synth1 o pEZ-Synth2 por digestión de Not I y se utilizaron como moldes en reacciones IVT utilizando ARN polimerasa T7. El ARN resultante se trató a continuación con DNasa para eliminar el molde de ADN del plásmido residual. Los ARN ITV se cuantificaron mediante Nanodrop.

A continuación, se construyeron mezclas de ARN de control que comprende ARN de base, que imita la complejidad del ARN de las muestras clínicas, añadidas a mezclas conocidas de ARN IVT obtenidas a partir de Synth1 y Synth2. En principio, una serie de mezclas de control de ARN para un ensayo de impronta tendrá por lo general las siguientes propiedades: i) simular la complejidad del transcriptoma de una muestra de ensayo habitual, ii) contener una relación conocida de las cantidades de los dos ácidos nucleicos del control, y iii) ser construida de tal manera que la relación de la cantidad de ARN IVT de control (es decir, la suma de todas las moléculas del ARN IVT de Synth1 y Synth2 en este ejemplo), en relación a la cantidad de ARN total del control (es decir, la cantidad total del ARN de base añadido a las mezclas de ARN IVT de Synth1 y Synth2), es similar a la relación de la cantidad de ARNm del IGF2 nativo presente habitualmente en una muestra clínica, en relación a la cantidad total de ARN que está habitualmente presente en unamuestra clínica.

Para modelar de forma precisa las fuentes de variabilidad potenciales en un ensayo diseñado para monitorizar la LOI en una muestra biológica utilizando cantidades de ARN de control de entrada conocidas, se determinó en primer lugar la cantidad de ARNm del IGF2 que se esperaría estuvieran presentes en una muestra biológica determinada. Para lograr esto, se generó una serie de mezclas del ARN molde. Para que la mezcla de ARN reflejara la complejidad deltranscriptoma deuna muestra biológica,una serie de cantidadesconocidasde ARN IVTgeneradoa partir de Synth2 se añadió a alícuotas de 500ng de ARN total de levadura. Esta cantidad de ARN total de levadura se utilizó porque la cantidad de entrada de ARN total habitual para el ensayo de LOI es 500 ng. Se utilizó ARN total de levadura como una fuente de ARN que carece de ARNm del IGF2 para imitar la complejidad de los ARN presentes en la muestra de ARN sanguíneo, y aun así asegurar que la amplificación por RT-PCR se obtendría del ARN de control añadido, más que de la fuente de ARN de base. Las series de mezclas de ARN molde incluían ARN IVT añadido en la cantidad de 120 ng, 12 ng, 1.2 ng, 120 pg, 12 pg, 1.2 pg, 120 fg, 12 fg o 1,2 fg (es decir, se realizaron nueve mezclas independientes, cada una con una de estas cantidades de ARN IVT de entrada).

De forma alternativa, puede añadirse ARN IVT de Synth1 y/o Synth2 a otras fuentes de ARN complejo que son similares en complejidad a la fuente de ARN en las muestras clínicas con estado de impronta desconocido, y que carecen sustancialmente de ARNm del IGF2. Ejemplos de fuentes de ARN de base alternativas, que son útiles en combinación con ARN IVT de Synth1 y/o Synth2 como control para ensayos de muestras de humanos incluyen i) ARN obtenido de células eucariotas o líneas celulares que carecen de expresión del IGF2 (por ejemplo, células de ratón con inactivación genética del IGF2 (knock out)), ii) ARN obtenido de células eucariotas o líneas celulares que carecen del gen homólogo del IGF2, o que tienen suficiente divergencia de secuencia de la secuencia del IGF2 humano, de tal manera que los polinucleótidos de los ensayos de genotipado e impronta del IGF2 no hibridan con los transcritos del homólogo del IGF2 de células eucariotas, iii) ARN obtenido de células humanas que carecen de expresión del IGF2 (por ejemplo, células de teratoma ovárico en las cuales ambas copias del IGF2 se imprimen maternalmente y que se confirman están silenciadas transcripcionalmente), iv) ARN obtenido de células humanas modificadas genéticamente que carecen de expresión del IGF2, o v) extracciones de ARN de células humanas en las que una vez presente el ARNm del IGF2 ha sido eliminado.

A continuación, se diseñaron cuatro ensayos qRT-PCR que utilizaron los cuatro pares de cebadores de PCR indicados en la Figura 13E. Cada una de las nueve mezclas de ARN (donde cada una incluye 500ng de ARN total de levadura y una de las nueve cantidades de ARN de control IVT añadido) se utilizó como molde para la RT-PCR tal como se representa mediante un diagrama en la Figura 13. Se realizó un control que carece de transcriptasa inversapara cada mezcla del molde paraasegurarque la amplificación aguas abajo (downstream) se obtuvo a partir de ADNc, en lugar de ADN contaminante potencial. Las reacciones de PCR de segunda ronda se realizaron en un tampón de reacción que incluye verde SYBR, y se determinaron los valores del Ct. Las reacciones se realizaron por duplicado y se halló la media de los valores del Ct. Estos datos fueron utilizados para construir una curva estándar de los valores del Ct a través de un amplio rango de cantidades conocidas de ARN IVT de control de entrada.

A continuación, los mismos ensayos de qRT-PCR se realizaron sobre el ARN total extraído de muestras de sangre obtenidas a partir de cuatro individuos diferentes. En cada reacción, se utilizaron 500ng del ARN total como molde para la RT-PCR, según se representa en un diagrama en la Figura 13. Se realizó un control que carece de transcriptasa inversa para cada mezcla del molde, para asegurar que la amplificación aguas abajo fue obtenida a partir de ADNc en lugar de ADN genómico contaminante potencial. Las reacciones de PCR de segunda ronda se llevaron a cabo en un tampón de reacción que incluye verde SYBR, y se determinaron los valores del Ct. Las reaccionesse realizaron por duplicado y se halló la media de los valores de Ct.

Los valores Ct obtenidos para cada uno de los cuatro amplicones de PCR obtenidos de ARN de la sangre, fueron extrapolados con respecto a los valores de la curva estándar obtenidos de la serie de mezclas de ARN IVT/ARN de levadura. El valor del Ctde media de las cuatro muestras de sangre fue similar al valor del Ctque se obtuvo de 84 pg de Synth 1, Synth2, o una mezcla de Synth1 y Synth2. Por lo tanto, la cantidad de ARN IVT de control total (es decir, la cantidad de ARN IVT de control obtenido de Synth1 más la cantidad de ARN IVT de control obtenido de Synth2) a ser utilizada en experimentos de curvas de control, se estableció en 120 pg, una cantidad ∼50% mayor que la cantidad media en 500ng de ARN sanguíneo. Esta cantidad (es decir, 120 pg) de ARN IVT de control se seleccionó de manera que i) excediera ligeramente la cantidad habitual del ARNm del IGF2 que se espera esté presente en una muestra de 500 ng de ARN total aislado de una muestra de sangre entera, y ii) proporcionaría un éxito de amplificación por RT-PCR consistente cuando se utilice en experimentos de ARN de controlmúltiples.

Para determinar la linealidad cuantitativa de todas las etapas del ensayo para monitorizar la expresión específica de alelo del IGF2, el ARN IVT obtenido del Synth1 se mezcló con ARN IVT obtenido del Synth2 en relaciones que incluyen 10:1, 8:1, 6:1, 4:1, 3:1, 2:1, 1:1, 1:2, 1:3, 1:4, 1:6, 1:8, y 1:10 (Synth1 :Synth2). Un total de 120 pg de cada mezcla de ARN IVT de Synth1 :Synth2 (es decir, la cantidad de ARN de control IVT obtenido del Synth1 más la cantidad de ARN de controlIVTobtenido delSynth2 fue igual a 120 pg)se añadió a 500 ngde ARN de levadura(es decir, trece mezclas fueron producidas, donde cada una contiene 500 ng de ARN de levadura más 120 ng de una de las trece relaciones de Synth1:Synth2 descritas anteriormente). Esta mezcla de ARN se utilizó como molde para las reacciones de RT-PCR descritas en la Figura 13. Para cada punto de relación, se realizó una reacción de control que carece de RT para asegurar que la amplificación se obtuvo de ARN IVT en lugar de cualquier ADN contaminante residual. A continuación de la síntesis de ADNc de primera cadena,se utilizó 1 µL de cada reacción de RT+ o RT-como molde para la amplificación por PCR anidada de los cuatro amplicones representados en un diagrama en la Figura 13E. Un alícuota de cada reacción de PCR fue analizado en gel de agarosa para confirmar que no hubo presente ninguna amplificación en las reacciones obtenidas a partir de la reacción de control de RT-. Los amplicones obtenidos de las mezclas de la relación Synth1:Synth2 fueron purificados individualmente en columnas decentrifugado depurificación porPCR(Qiagen),yseutilizaron comomolde para elensayo multiplexde extensión de cebadores de un único nucleótido descrito en el Ejemplo 5. Se realizaron ensayos por triplicado (específicamente, cada reacción triplicada incluyó una reacción de RT, tres reacciones independientes de PCR de primera ronda por amplicón, tres reacciones independientes de PCR de segunda ronda por amplicón y tres reaccionesmultiplex independientes del ensayo de extensión de cebadores), y se calcularon las relaciones de media de las áreas de picos para cada ensayo de extensión de cebadores. Los datos resultantes se representaron en la Figura 15.

En laFigura 15,la relacióndeentrada conocida delmolde de ARN IVTde Synth1:Synth2 se representó en el eje X. Para cada ensayo de extensión de cebadores de un único nucleótido basado en SNP dentro del ensayo multiplex, la relación medida demedia delárea de picosquerepresenta el alelo Synth 1yel alelo Synth2 se representó en el eje

Y. En el gráfico, las barras de error indican más / menos una desviación estándar a lo largo de las mediciones triplicadas. Todos los valores de puntos de datos de media se multiplicaron por un factor de normalización común que ajusta elvalormedido para elpunto de datosconocido 1:1 para quesea exactamente iguala 1,0.Los datos se representaron en una escala logarítmica para visualizar uniformemente todos los puntos de datos a lo largo de la serie derelaciones.Semuestran losdatosobtenidos de un ensayo basado en SNPqueutiliza unaposición delSNP dentro de los cuatro amplicones. Estos incluyen ensayos que utilizan los SNP representados por la SEQ ID NO: 7 dentro del Amplicón (Figura 15 A), SEQ ID NO: 5 dentro del Amplicón 2 (Figura 15 B), SEQ ID NO: 1 dentro del Amplicón 3 (Figura 15 C)ySEQ ID NO: 13 dentro del Amplicón 4 (Figura 15 D).

Estos datos demuestran que el ensayo fue cuantitativo y reproducible en este rango, y que el par de mezclas de ácido nucleico de control en la forma de ARN IVT obtenido de Synth1 y Synth2 proporcionó, en una única dilución en serie, un conjunto de datos de curva estándar para todos los 16 SNP. Las mediciones de expresión específica de alelo de esta serie de mezclas pueden ejecutarse junto con mediciones de ensayos de impronta de muestras clínicas, de tal manera que las mediciones de las muestras con relaciones de alelos desconocidas pueden ser extrapoladas contra una curva estándar generada de la serie de mezclas de control para determinar la abundancia relativa de moléculas que contienen los dos alelos.

Adicionalmente, estos datos demuestran el uso de mezclas de ARN de control para indicar desviaciones de los resultados de los ensayos de los resultados esperados, además de para señalar qué componentes del ensayo son responsables para esta variación. Por ejemplo, las relaciones cuantificadas de alelos obtenidas a partir de un SNP localizado en tres de los cuatro amplicones de primera ronda y segunda ronda (Ampl, Amp2 y Amp3 -ver localizaciones de amplicones en la Figura 13 E), demostraron una estrecha correlación con las relaciones de alelos de entrada esperadas (Figura 15A, B y C). Además, las relaciones de alelos obtenidas a partir de un segundo SNP localizado en el mismo amplicón indicó una estrecha correlación muy similar entre las relaciones de alelos medidas e introducidas (comparar la Figura 15B que representa la curva de un primer SNP en el Amp1, y la Figura 15E que representa la curva de un segundo SNP también en el Amp1). Estos datos confirmaron que las mezclas de la relación del ARN de control fueron precisas y que todas las etapas y todos los componentes de ensayo, en los ensayos que implican los amplicones1, 2 y 3 (incluyendo reacciones RT, PCR y de extensión de cebadores de un único nucleótido) indicaron mediciones cuantitativas precisas. Sin embargo, las relaciones de alelos cuantificados obtenidos de un SNP localizado en el amplicón de primera ronda y segunda ronda Amp4 (ver localización en la Figura 13 E) demostró una desviación significativa entre relaciones de alelos de entrada y medidas (observar las desviaciones de la línea para los puntos de datos en los cuadrantes inferiores izquierdos de la Figura 15D y F). La Figura 15D representa las relaciones alélicas obtenidas de un primer SNP dentro del amplicón 4 representado por la SEQ ID NO: 13, mientras que la Figura 15F representa las relaciones alélicas obtenidas de un segundo SNP dentro del Amp4, representado por la SEQ ID NO: 14. Para un punto de datos determinado en cada gráfico, las desviaciones estándar a lo largo de las mediciones triplicadas son pequeñas, lo que indica que las desviaciones no fueron principalmente debido a variaciones en la PCR de primera ronda, PCR de segunda ronda y en el componente de la reacción de extensión de cebadores del ensayo, ya que las mediciones triplicadas fueron réplicas independientes de estas tres etapas. Además, la dirección y magnitud que cada punto de datos para cada relación de entrada desviada de la línea esperada en los dos gráficos (D y F) es notablemente similar entre los datos obtenidos de las dos posiciones de SNP independientes dentro del mismo amplicón. En base a una comparación con la curva de control, puede determinarse que estos resultados indican que la variabilidad ocurrió aguas arriba de las reacciones de extensión de cebadores triplicadas, la amplificación por PCR de 2ª ronda triplicada, y la amplificación por PCR de 1ª ronda triplicada. Además, debido a que tres de cuatro amplicones registraron los resultados esperados, la variabilidad no tuvo lugar en la reacción IVT o en la preparación de las mezclas de ARN IVT. Los resultados son, en lugar de ello, consistentes con la variabilidad que se introduce en la etapa de RT no replicada, específicamente la transcripción inversa del ADNc de primera cadena, utilizando el cebador RT requerido para amplificar por RT-PCR el Amp4 (el cebador RT más a la derecha representado en un diagrama en la Figura 13 B). En contraste con esta fuente de variabilidad, consideremos el punto de datos para la mezcla 2:1 Synth1:Synth2 en la Figura 15D. En este caso, la variabilidad sustancial se ve en las mediciones de la relación de alelos triplicada (reflejada por la gran desviación estándar). En este caso, la fuente de variabilidad tuvo lugar probablemente en una o más de las reacciones triplicadas (PCR de 1ª ronda, PCR de 2ª ronda, reacción de extensión de cebadores o detección de picos y área de cálculo).

Ejemplo 8. Uso de controles de ARN para determinar abundancia relativa de abundancia de expresión específica de alelo en muestras de sangre.

ADN genómicos extraídos de dos muestras de sangre entera (A y B) fueron genotipadas utilizando el ensayo de extensión de cebadores de un único nucleótido descrito en el Ejemplo 5. La Muestra A fue heterocigota (y, por lo tanto, informativa) para los SNP representados por las SEQ ID Nos: 3, 11 y 12. La Muestra B fue heterocigota (y, por lo tanto, informativa) para los SNP representados por la SEQ IDs: 5 y 16 (Tabla 11).

El ARN total fue extraído de las mismas dos muestras de sangre (A y B). Para cada una, se utilizó 500 ng de ARN como molde para la síntesis de ADNc de primera cadena según se describe en el Ejemplo 7. Se llevó a cabo una reacción de control que carece de transcriptasa inversa para asegurar que la amplificación se obtuvo del ADNc en lugar del ADN genómico contaminante potencial. A continuación de la síntesis de ADNc de primera cadena, se utilizó 1 µL de cada reacción de RT+ o RT-como molde para la amplificación por PCR anidada de los cuatro amplicones, según se describe en el Ejemplo 7 y según se representa en un diagrama en la Figura 13. Un alícuota de cada reacción de PCR fue analizado en gel de agarosa para confirmar que no hubo presente ninguna amplificación en las reacciones obtenidas a partir de la reacción de control de RT-. Los amplicones fueron purificados individualmente en columnas de centrifugado de purificación por PCR (Qiagen), y se utilizaron como molde para el ensayo multiplex de extensión de cebadores de un único nucleótido descrito en el Ejemplo 5. Las áreas de picos en bruto resultantes y las relaciones de áreas de picosse proporcionan en la Tabla 11.

Debido a que la Muestra A era heterocigota en las posiciones del SNP representadas por las SEQ ID Nos: 3, 11 y 12, estos tres ensayos basados en SNP específicos fueron informativos para medir la LOI del IGF2 (Tabla 11). En los ADNc sometidos a prueba para la Muestra A, el ensayo de extensión de cebadores de un único nucleótido para la SEQ ID NO: 3 detectó un pico únicamente para el alelo de C (no se detectó ningún pico para el alelo de A). En los ADNc probados para la Muestra A, el ensayo de extensión de cebadores de un único nucleótido para la SEQ ID NO: 11 detectó un pico únicamente para el alelo de G (no se detectó ningún pico para el alelo de A). En los ADNc sometidos a prueba para la Muestra A, el ensayo de extensión de cebadores de un único nucleótido para la SEQ ID NO: 12 detectó un pico únicamente para el alelo de C (no se detectó ningún pico para el alelo de T). Por lo tanto, se determinó que esta muestra mostraba una impronta normal del IGF2. Es decir, sólo uno de los dos alelos del gen IGF2 fue expresado. Este alelo incluye los nucleótidos C,G yC en las posiciones del SNP representadas por la SEQ ID NO: 3, 11 y 12, respectivamente. El otro alelo (que incluye los nucleótidos A, A y T en las posiciones del SNP representadas por la SEQ ID NO: 3, 11 y12, respectivamente)tenía impronta y no se detectó ninguna expresión.

La Muestra B era heterocigota en las posiciones del SNP representadas por las SEQ ID Nos: 5 y 16 (Tabla 11). En los ADNc sometidos a prueba para la Muestra B, el ensayo de extensión de cebadores de un único nucleótido para la SEQ ID NO: 16 detectó un pico únicamente para el alelo de A (no se detectó ningún pico para el alelo de G). Sin embargo, el ensayo de extensión de cebadores de un único nucleótido para la SEQ ID NO: 5 detectó picos por encima de la base para ambos alelos (de G y A, respectivamente). Observar que estos nucleótidos representan lacadena complementaria relativa a la secuencia indicada en la SEQ ID NO: 5. La relación del Área de Picos 1:Área de Picos 2 fue de 0,445. En algunos informes, se considera que la pérdida de impronta del IGF2 está presente si la relación de los dos alelos detectados está entre 1:3 y 3:1 (es decir, relaciones entre 0,333 y 3,0). Este resultado en bruto para la Muestra B parecería indicar que los ensayos de SNP para la SEQ ID NO: 5 y SEQ ID NO: 16 registraron diferentes resultados de LOI (es decir la SEQ ID NO: 16 indicó una impronta normal y al SEQ ID NO: 5 indicó una LOI).Sin embargo,larelación de0,445 nofue corregida extrapolando contra laserie decontrol estándar de las relaciones conocidas de alelos de ARN de entrada mostradas en la Figura 15B. La ecuación lineal para esta serie de datos de control es y = 0,8717x + 0,2032. La relación de medida, y, es 0,445. Por lo tanto, utilizando este valor para resolver la relación de entrada, x, se determinó que el valor corregido fue 0,278. Por lo tanto, mediante la definicióndelaLOI según se describe anteriormente(0,333 –3,0),este ensayo indicó quela muestra Bnopresenta LOI del IGF2.

Se entiende que los ejemplos y modos de realización descritos en la presente patente tienen propósitos ilustrativos únicamente y que diversas modificaciones o cambios, a la vista de los mismos, podrán ser sugeridos a aquellas personas expertas en el arte.

Tabla 1. Polimorfismos de un único nucleótido no publicados en el exón 9 del IGF2.

SEQ ID NO:: Posición Genómica* Alelos Secuencia

1: 2108417 TTCCCCCTCTTTGTTTCTTGGGGCA[T/G]TTTTCCTTTTTTTTTTTTTTTTGTT

2: 2110187 GGACCCCAGAAATCACAGGTGGGCA[C/T/G/A]GTCGCTGCTACCGCCATCTCCCTTC

3: 2109220 GCGCACACACACGCACACCCCCACA[A/C]AATTGGATGAAAACAATAAGCATAT

4: 2108843 CATTCCCGATACACCTTACTTACTG[T/C]GTGTTGGCCCAGCCAGAGTGAGGAA

5: 2108835 ATACACCTTACTTACTGTGTGTTGG[C/T]CCAGCCAGAGTGAGGAAGGAGTTTG

6: 2107668 ATGCCATAGCAGCCACCACCGCGGC[G/A]CCTAGGGCTGCGGCAGGGACTCGGC

*Coordenadas en relación a NCBI Build 36, Chr:11

Tabla 2. Polimorfismos de un único nucleótido identificados previamente en el exón 9 del IGF2. Tabla 3. Heterocigosidad observada de los SNP del IGF2 transcritos en Poblaciones Humanas Tabla 4. Heterocigosidad observada para combinaciones de SNP transcritos del IGF2 en poblaciones Humanas

SEQ ID NO:: Posición Genómica* dbSNP ID Alelos Secuencia

7: 2110764 rs2230949 [C/T] AAACTGCCGCAAGTCTGCAGCCCGG[C/T]GCCACCATCCTGCAGCCTCCTCCTG

8: 2110210 rs680 [G/A] CTGAACCAGCAAAGAGAAAAGAAGG[G/A]CCCCAGAAATCACAGGTGGGCACGT

9: 2109215 rs1065687 [G/A] CACACACGCACACCCCCACAAAATT[G/A]GATGAAAACAATAAGCATATCTAAG

10: 2109117 rs3168310 [C/G] CCAATGTTTTCATGGTCTGAGCCCC[C/G]CTCCTGTTCCCATCTCCACTGCCCC

11: 2108682 rs57156844 [C/T] ACATTTCTTGGGGGGTCCCCAGGAGA[C/T]GGGCAAAGATGATCCCTAGGTGTGC

12: 2108628 rs3802971 [C/T] AGTCCTCGGGGGCCGTGCACTGATG[C/T]GGGAGTGTGGGAAGTCTGGCGGTT

13: 2107971 rs11825733 [G/A] AGGCTGGCCGGAGGGGAAGGGGCTA[G/A]CAGGTGTGTAAACAGAGGGTTCCAT

14: 2107471 rs11564732 [G/A] AGTCGCAGAGGGTCCCTCGGCAAGC[G/A]CCCTGTGAGTGGGCCATTCGGAACA

15: 2107273 rs7873 [A/G] GTGTTCCCGGGGGCACTTGCCGACC[A/G]GCCCCTTGCGTCCCCAGGTTTGCAG

16: 2107020 rs2585 [G/A] TGCGGCCCGTGTTTGACTCAACTCA[G/A]CTCCTTTAACGCTAATATTTCCGGC

*Coordenadas en relación a NCBI Build 36, Chr:11

General: AA CAU MEX JPN CHI

SEQ ID NO:: Posición Genómica* % het het del total % het het del total % het het del total % het het del total % het het del total % het het del total

1: 2108417 16,1% 36 de 223 16,2 12 de 74 18,8% 15 de 80 13,0% 9 de 69 --- --- --- ---

2: 2110187 31,1% 23 de 74 31,1% 23 de 74 --- --- --- --- --- --- --- ---

3: 2109220 24,3% 18 de 74 24,3% 18 de 74 --- --- --- --- --- --- --- ---

4: 2108843 6,8% 5 de 74 6,8% 5 de 74 --- --- --- --- --- --- --- ---

5: 2108835 14,0% 21 de 150 --- --- 14,0% 21 de 150 --- --- --- --- --- ---

6: 2107668 6,7% 10 de 150 --- --- --- --- --- --- 2,5% 2 de 79 11,3% 8 de 71

7: 2110764 11,9% 35 de 293 14,9% 11 de 74 10,7% 16 de 150 11,6% 8 de 69 --- --- --- ---

8: 2110210 45,6% 202 de 443 18,9% 14 de 74 54,7% 82 de 150 31,9% 22 de 69 57,0% 45 de 79 54,9% 39 de 71

9: 2109215 9,1% 20 de 219 --- --- 12,7% 19 de 150 1,4% 1 de 69 --- --- --- ---

10: 2109117 35,0% 155 de 443 28,4% 21 de 74 36,7% 55 de 150 33,3% 23 de 69 30,4% 24 de 79 45,1% 32 de 71

11: 2108682 20,3% 29 de 143 37,8% 28 de 74 --- --- 1,4% 1 de 69 --- --- --- ---

12: 2108628 15,3% 68 de 443 9,5% 7 de 74 10,7% 16 de 150 13,0% 9 de 69 21,5% 17 de 79 26,8% 19 de 71

13: 2107971 14,9% 11 de 74 14,9% 11 de 74 --- --- --- --- --- --- --- ---

14: 2107471 7,0% 21 de 298 --- --- 0,7% 1 de 150 20,3% 14 de 69 7,6% 6 de 79 --- ---

15: 2107273 20,5% 60 de 293 35,1% 26 de 74 16,0% 24 de 150 14,5% 10 de 69 --- --- --- ---

16: 2107020 45,1% 200 de 443 21,6% 16 de 74 41,3% 62 de 150 37,7% 26 de 69 63,3% 50 de 79 64,8% 46 de 71

Grupo Humano # Het # Total Panel A Panel B Panel C Panel D Panel E General

358 443 80,81% 78,56% 78,56% 75,17%

61,17% Chino 52 71 73,24% 71,83% 71,83% 69,01% 70,42% Japonés 59 79 74,68% 74,68% 74,68% 72,15% 73,42% Mejicano 51 69 73,91% 71,01% 72,46% 68,12% 60,87% Afroamericano 68 74 91,89% 82,43% 81,08% 78,38% 31,08% Caucásico 128 150 85,33% 85,33% 85,33% 81,33% 65,33%

Tabla 5. Seq ID Nos para las combinaciones descritas en la Tabla 4

Panel Panel A Panel B Panel C Panel D Panel E 1

8 2 2 5511 3 4 8814 4 5 9916 5 8 1010 6 9 1111 7 10 12 14 8 12 14 15 9 13 15 16 10 14 16 11 15 12 16 13 14 15 16

# Total de SNP: 16 12 10 9 4

Tabla 6. Linealidad de ensayos que miden las relaciones específicas de alelo de 13 SNP independientes

SEQ ID R2 Gradiente 2

0.9986

0,8256 3 0,9817 0,5946 4 0,9995 0,8973 5 0,9963 0,8351 6 0,9757 0,6219 7 0,9949 0,7825 8 0,9915 0,8494 9 0,9949 0,8297 10 0,9964 0,814 11 0,9988 0,8681 14 0,9987 0,835 15 0,9953 0,818 16 0,9984 0,8531

Tabla 7.Resultados de ensayo multiplex para el estado del genotipo e impronta del IGF2. Tabla 8. Comparaciones de áreas de picos para el análisis del genotipo y el estado de la impronta del IGF2. Tabla 9. Posiciones y genotipos de SNP en Synth1 y Synth2

ADN Genómico *: ARN Total †

Muestra: SEQ ID NO: Alelo 1 Alelo 2 Alelo 1 Alelo 2 Genotipo* Expresióna

A: 1 T T hom n/a

A: 2 G G hom n/a

A: 3 G T T informativo impreso

A: 4 T T hom n/a

A: 5 G G hom n/a

A: 6 G G hom n/a

A: 7 G G hom n/a

A: 8 G G hom n/a

A: 9 G G hom n/a

A: 10 C A C hom n/a

A: 11 G G informativo impreso

A: 12 C T C informativo impreso

A: 13 G G hom n/a

A: 14 G G hom n/a

A: 15 A A hom n/a

A: 16 G G hom n/a

B: 1 T T hom n/a

B: 2 T T hom n/a

B: 3 G G hom n/a

B: 4 T T hom n/a

B: 5 G A G A informativo Línea límite

B: 6 G G hom n/a

B: 7 G G hom n/a

B: 8 G G hom n/a

B: 9 G G hom n/a

B: 10 C C hom n/a

B: 11 G G hom n/a

B: 12 C C hom n/a

B: 13 G G hom n/a

B: 14 G G hom n/a

B: 15 A A hom n/a

B: 16 G A G informativo impreso

*Genotipos en cada uno de los diez SNP sometidos a ensayo. †Alelos detectados en transcritos expresados del IGF2. ‡Indica homocigoto (hom) o heterocigoto e informativo (informativo) en cada SNP. aImpreso: expresión monoalélica del IGF2; n/a: resultado no aplicable debido a homocigosidad en el SNP en particular.

ADN Genómico*: ARN Total †

Muestra: SEQ ID NO: Área de picos 1 Área de picos 2 Alelo 1: Alelo 2ª Factor de Normalización Área de picos Área de picos Alelo 1: Alelo 2c

A: 1 58328 0 - - 78730 0 -

A: 2 153330 0 - 126343 0 -

A: 3 67871 30193 2,2479 0,4449 0 0 36005 -

A: 4 5030 0 - 3669 0 -

A: 5 40432 0 - 28478 0 -

A: 6 25890 0 - 9038 0 -

A: 7 134730 0 - 120747 0 -

A: 8 88657 0 - 77231 0 -

A: 9 22926 0 - 39965 0 -

A: 10 79426 0 - 48415 0 -

A: 11 97000 106229 0,9131 1,0951 103671 0 -

A: 12 54813 163646 0,3349 2,9855 59419 0 -

A: 13 40100 0 - 33286 0 -

A: 14 10205 0 - 6230 0 -

A: 15 96528 0 - 49735 0 -

A: 16 136263 0 - 138675 0 -

B: 1 60360 0 - 71841 0 -

B: 2 0 124496 - 0 79158 -

B: 3 37814 0 - 35854 0 -

B: 4 3850 0 - 4377 0 -

B: 5 16043 12107 1,3251 0,7547 6283 14115 0,3359

B: 6 19750 0 - 8647 0 -

B: 7 95420 0 - 96206 0 -

B: 8 61002 0 - 38661 0 -

B: 9 29844 0 - 54430 0 -

B: 10 50863 0 - 48856 0 -

B: 11 109546 0 - 112126 0 -

B: 12 60364 0 - 61683 0 -

B: 13 39767 0 - 38418 0 -

B: 14 14754 0 - 9525 0 -

B: 15 110227 0 - 55892 0 -

B: 16 63791 58086 1,0982 0,9106 108307 0 -

*Datos para los ensayos de genotipos. †Datos para el análisis de expresión específica de Alelos aRelación calculada del genotipado del área de picos 1/genotipado del área de picos 2 bNormalización para representar las diferencias de intensidad del colorante (1/( genotipado del área de picos 1/ genotipado del área de picos 2)) cRelación normalizada calculada para la expresión del área de picos 1/expresión del área de picos 2 ((Expresión del área de picos 1/Expresión del área de picos 2)*Factor de normalización)

SEQ ID NO:: Posición Genómicaa Posiciónb de Synth1 y Synth2 Posibles alelos Alelo Synth1 Alelo Synth2 Secuencia

1: 2108417 2089 [T/G] T G TTCCCCCTCTTTGTTTCTTGGGGCA[T/G]TTTTCCTTTTTTTTTTTTT TTTGTT

2: 2110187 897 [C/T] C T GGACCCCAGAAATCACAGGTGGGCA[C/T/G/A]GTCGCTGCTACCG CCATCTCCCTTC

3: 2109220 1286 [A/C] A C GCGCACACACACGCACACCCCCACA[A/C]AATTGGATGAAAACAA TAAGCATAT

4: 2108843 1663 [T/C] T C CATTCCCGATACACCTTACTTACTG[T/C]GTGTTGGCCCAGCCAGA GTGAGGAA

5: 2108835 1671 [C/T] C T ATACACCTTACTTACTGTGTGTTGG[C/T]CCAGCCAGAGTGAGGAA GGAGGTTTG

6: 2107668 2838 [G/A] G A ATGCCATAGCAGCCACCACCGCGGC[G/A]CCTAGGGCTGGCAGG GACTCGGC

7: 2110764 320 [C/T] C T AAACTGCCGCAAGTCTGCACCCCGG[C/T]GCCACCATCCTGCAGC CTCCTCCTG

8: 2110210 874 [G/A] A G CTGAACCAGCAAAGAGAAAAGAAGG[G/A]CCCCAGAAATCACAGG TGGGCACGT

9: 2109215 1291 [G/A] G A CACACACGCACACCCCCACAAAATT[G/A]GATGAAAACAATAAGCA TATCTAAG

10: 2109117 1389 [C/G] G C CCAATGTTTTCATGGTCTGAGCCCC[C/G]CTCCTGTTCCCATCTCC ACTGCCCC

11: 2108682 1824 [C/T] Gc Ac ACATTTCTTGGGGGGTCCCCAGGAGA[G/T]GGGCAAAGATGATCC CTAGGTGTGC

12: 2108628 1878 [C/T] C T AGTCCTCGGGGGCCGTGCACTGATG[C/T]GGGGAGTGTGGGAAG TCTGGCGGTT

13: 2107971 2535 [G/A] G A AGGCTGGCCGGAGGGGAAGGGGCTA[G/A]CAGGTGTGTAAACAG AGGGTTCCAT

14: 2107471 3035 [G/A] G A AGTCGCAGAGGGTCCCTCGGCAAGC[G/A]CCCTGTGAGTGGGCC ATTCGGAACA

15: 2107273 3233 [A/G] A G GTGTTCCCGGGGGCACTTGCCGACC[A/G]GCCCCTTGCGTCCCC AGGTTTGCAG

16: 2107020 3486 [G/A] A G TGCGGCCCGTGTTTGACTCAACTCA[G/A]CTCCTTTAACGCTAATA TTTCCGGC

aCoordenadas en relación a NCBI Build 36, Chr.11 bCoordenadas en relación a la SEQ ID:18 y SEQ ID:20 c Las secuencias proporcionada en las columnas “Secuencia” y “Posibles Alelos” corresponden a la cadena opuesta en relación a la que se muestra en las columnas “Alelo Synth1” y “Alelo Synth2”.

Tabla de secuencias SEQ ID NO:1 TTCCCCCTCTTTGTTTCTTGGGGCA[T/G]TTTTCCTTTTTTTTTTTTTTTTGTT SEQ ID NO:2 GGACCCCAGAAATCACAGGTGGGCA[C/T/G/A]GTCGCTGCTACCGCCATCTCCCT TC SEQ ID NO:3 GCGCACACACACGCACACCCCCACA[A/C]AATTGGATGAAAACAATAAGCATAT SEQ ID NO:4 CATTCCCGATACACCTTACTTACTG[T/C]GTGTTGGCCCAGCCAGAGTGAGGAA SEQ ID NO:5 ATACACCTTACTTACTGTGTGTTGG[C/T]CCAGCCAGAGTGAGGAAGGAGTTTG SEQ ID NO:6 ATGCCATAGCAGCCACCACCGCGGC[G/A]CCTAGGGCTGCGGCAGGGACTCGGC SEQ ID NO:7 AAACTGCCGCAAGTCTGCAGCCCGG[C/T]GCCACCATCCTGCAGCCTCCTCCTG SEQ ID NO:8 CTGAACCAGCAAAGAGAAA.AGAAGG[G/A]CCCCAGAAATCACAGGTGGGCACG T SEQ ID NO:9 CACACACGCACACCCCCACAAAATT[G/A]GATGAAAACAATAAGCATATCTAAG SEQ ID NO: 10 CCAATGTTTTCATGGTCTGAGCCCC[C/G]CTCCTGTTCCCATCTCCACTGCCCC SEQ ID NO:11 ACATTTCTTGGGGGGTCCCCAGGAGA[C/T]GGGCAAAGATGATCCCTAGGTGTG C SEQ ID NO: 12 AGTCCTCGGGGGCCGTGCACTGATG[C/T]GGGGAGTGTGGGAAGTCTGGCGGTT SEQ ID NO:13 AGGCTGGCCGGAGGGGAAGGGGCTA[G/A]CAGGTGTGTAAACAGAGGGTTCCA T SEQ ID NO: 14 AGTCGCAGAGGGTCCCTCGGCAAGC[G/A]CCCTGTGAGTGGGCCATTCGGAACA SEQ ID NO: 15 GTGTTCCCGGGGGCACTTGCCGACC[A/G]GCCCCTTGCGTCCCCAGGTTTGCAG SEQ ID NO:16 TGCGGCCCGTGTTTGACTCAACTCA[G/A]CTCCTTTAACGCTAATATTTCCGGC SEQ ID NO:17 NM_000612

SEQ ID NO:18 ENST00000300632

SEQ ID NO:19 ENSG00000167244

SEQ ID NO:20

Secuencia del exón 9 del IGF2, registro del Ensemble del exón ENSE00001488587 (Human GRCh37, Febrero 2009)

SEQ ID NO:21 Synth 1

SEQ ID NO:22 Región rica en repeticiones CA de la SEQ ID NO:20

SEQ ID NO:23 Secuencia de Synth 2 Listado de secuencias

<110> Ordway, Jared Maloney, Rebecca

5 Lakey, Nathan Budiman, Muhammad A.

Orion Genomics LLC

<120> COMBINACIONES DE POLIMORFISMOS PARA DETERMINAR LA EXPRESIÓN ESPECÍFICA DE ALELO DEL IFG2

10 <130> 021031-002910PC

<150> US 61/207,450

<151> 2009-02-11

<160> 27

<170> FastSEQ para Windows Versión 4.0 15 <210> 1

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 1 ttccccctct ttgtttcttg gggcaktttt cctttttttt ttttttttgt t 51

<210> 2

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<220>

<221> misc_feature

<222> 26

<223> n = A,T,C o G

<400> 2 ggaccccaga aatcacaggt gggcangtcg ctgctaccgc catctccctt c 51

<210> 3

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 3 gcgcacacac acgcacaccc ccacamaatt ggatgaaaac aataagcata t 51

<210> 4

<211> 51

<212> ADN

<213> Secuencia artificial

<220> <223> Secuencia de polinucleótidos de SNP del IGF2

<400> 4 cattcccgat acaccttact tactgygtgt tggcccagcc agagtgagga a 51

<210> 5

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 5 atacacctta cttactgtgt gttggyccag ccagagtgag gaaggagttt g 51

<210> 6

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 6 atgccatagc agccaccacc gcggcrccta gggctgcggc agggactcgg c 51

<210> 7

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 7 aaactgccgc aagtctgcag cccggygcca ccatcctgca gcctcctcct g 51

<210> 8

<211> 51

<212> ADN

<213> Secuencia artificial <220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 8 ctgaaccagc aaagagaaaa gaaggrcccc agaaatcaca ggtgggcacg t 51

<210> 9

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 9 cacacacgca cacccccaca aaattrgatg aaaacaataa gcatatctaa g 51

<210> 10

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 10 ccaatgtttt catggtctga gccccsctcc tgttcccatc tccactgccc c 51

<210> 11

<211> 52

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 11 acatttcttg gggggtcccc aggagayggg caaagatgat ccctaggtgt gc 52

<210> 12

<211> 51

<212> ADN <213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 12 agtcctcggg ggccgtgcac tgatgygggg agtgtgggaa gtctggcggt t 51

<210> 13

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 13 aggctggccg gaggggaagg ggctarcagg tgtgtaaaca gagggttcca t 51

<210> 14

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 14 agtcgcagag ggtccctcgg caagcrccct gtgagtgggc cattcggaac a 51

<210> 15

<211> 51

<212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

<400> 15 gtgttcccgg gggcacttgc cgaccrgccc cttgcgtccc caggtttgca g 51

<210> 16

<211> 51 <212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia de polinucleótidos de SNP del IGF2

5 <400> 16 tgcggcccgt gtttgactca actcarctcc tttaacgcta atatttccgg c 51

<210> 17

<211> 5182

<212> ADN 10 <213> Homo sapiens

<220>

<223> NM_000612 – secuencia de nucleótidos del IGF2 (somatomedina A) variante de transcripto 1

<400> 17

<210> 18

<211> 5139

<212> ADN

<213> Homo sapiens

<220>

<223> secuencia de nucleótidos del registro del Ensemble del IGF2 ENST00000300632 (Human GRCh37, Febrero 2009)

<400> 18

<210> 19

<211> 21692 5 <212> ADN

<213> Homo sapiens

<220>

<223> Secuencia de nucleótidos del registro de genes del Ensemble del IGF2 ENSG00000167244 (Human GRCh37, Febrero 2009)

10 <400> 19

<210> 20

<211> 4112 5 <212> ADN

<213> Homo sapiens

<220>

<223> Secuencia del exón 9 del IGF2, registro del Ensemble del exón ENSE00001488587 (Human GRCh37, Febrero 2009)

10 <400> 20

<210> 21

<211> 3598

<212> ADN

<213> Secuencia artificial

<220>

<223> Synth1 – secuencia de nucleótidos del IGF2 sintético con secuencias parciales del exón 8 y9

<400> 21

<210> 22

<211> 578

<212> ADN

<213> Secuencia artificial

<220>

<223> región rica en repeticiones CA de la SEQ ID NO:20

<400> 22

<210> 23

<211> 3598

<212> ADN

<213> Secuencia artificial 15 <220>

<223> Synth2 – secuencia de nucleótidos del IFG2 sintético con secuencias parciales del exón 8 y9

<400> 23

<210> 24

<211> 29 5 <212> ADN

<213> Secuencia artificial

<220>

<223> Cebador sintético para el genotipado de la SEQ ID NO:8

<400> 24 10 gtccctgaac cagcaaagag aaaagaagg 29

<210> 25

<211> 82 <212> ADN

<213> Secuencia artificial

<220>

<223> Secuencia del amplicón sintético del IGF2 que comprende la SEQ ID NO:8

<400> 25

<210> 26

<211> 30

<212> ADN

<213> Secuencia artificial

<220>

<223> Cebador sintético para el genotipado de la SEQ ID NO:8 con etiqueta dNTP

<220>

<221> base_modificada

<222> (30)...(30)

<223> 3’ Amarcada con dR6G

<400> 26 gtccctgaac cagcaaagag aaaagaagga 30

<210> 27

<211> 30

<212> ADN

<213> Secuencia artificial

<220>

<223> Cebador sintético para el genotipado de la SEQ ID NO:8 con etiqueta dNTP

<220>

<221> base_modificada

<222> (30)...(30)

<223> 3’ G marcado con dR110

<400> 27 gtccctgaac cagcaaagag aaaagaaggg 30

Claims

REIVINDICACIONES

1. Método para determinar pérdida de impronta en el gen del Factor de Crecimiento Insulínico de tipo 2 (IGF2) de un individuo, donde elmétodo comprende

detectar el genotipo del SNP del gen IGF2 en el individuo, en donde

(a)

se determina el genotipo de al menos las SEQ ID Nos: 8, 11, 14, y 16, y opcionalmente también los SNP seleccionados del grupo que consiste en las SEQ ID Nos: 1, 5, 9, 10, 2, 3, 4, 6, 7, 12, 13 y 15, o

(b)

se determina el genotipo de almenoslas SEQ ID Nos: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15 y 16,

determinando de ese modo si el individuo es heterocigoto o homocigoto en cada uno de los SNP;

cuantificando en una muestra del individuo la cantidad de ARN que comprende dos opciones polimórficas de al menos un SNP heterocigoto;

determinando una relación de la cantidad de ARN que comprende dos opciones polimórficas de al menos un SNP heterocigoto; y correlacionando la relación de ARN con la pérdida de impronta del gen IGF2.
2. Método según la reivindicación 1, en donde la etapa de detección comprende detectar el genotipo del SNP de cada opción polimórfica de cada una de:

(i)

SEQ ID NOs: 1, 5, 8, 9, 10, 11, 14, 15, y 16; o

(ii)

SEQ ID NOs: 1,5,8,9, 10, 11, 12, 14, 15, y 16; o

(iii) SEQ ID NOs: 1, 2, 4, 5, 8, 9, 10, 12, 13, 14, 15, y 16, o

(iv) SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, y 16.
3.

Método según la reivindicación 1, en donde al menos un SNP adicional en la etapa de detección se selecciona del grupo que consiste en la SEQ ID NO: 1, 2, 3, 4, 5, y 6.
4.

Método según la reivindicación 1, en donde la etapa de correlación además comprende correlacionar la cantidad relativa de ARN que comprende las opciones polimórficas de al menos un SNP heterocigoto con un aumento del riesgo de cáncer, un diagnóstico o pronóstico de cáncer, o una predicción de la eficacia de un fármaco para mejorar, tratar o prevenir el cáncer.
5.

Método según la reivindicación 1, en donde al menos dos de los SNP detectados son heterocigotos y la etapa de cuantificación comprende cuantificar la cantidad de ARN que comprende dos opciones polimórficas en el al menos dos SNP heterocigotos.
6.

Método según la reivindicación 1, en donde la muestra en una muestra de sangre, heces, raspado celular o de tejido.
7.

Método según la reivindicación 1, en donde el ARN se transcribe de forma inversa en ADNc, y la cantidad de ADNcquecomprendecada opciónpolimórficaseutiliza paradeterminarla cantidad de ARNquecomprende lasdos opciones polimórficas.
8.

Método según la reivindicación 7, en donde la cantidad de ADNc específico de alelo se cuantifica en un método que comprende poner en contacto el ADNc con almenos un polinucleótido de detección específica de alelo.
9.

Método según la reivindicación 7, que comprende poner en contacto el ADNc con una cantidad suficiente de polinucleótidos de detección específicos de alelo, de tal manera que se determina la opción polimórfica para cada SNP heterocigota del grupo.
10.

Método según la reivindicación 9, que comprende poner en contacto el ADNc con una cantidad de polinucleótidos diferentes de detección específicos de alelo, en donde la cantidad es igual o mayor que el número de SNP heterocigotos en el grupo, de tal manera que al menos un polinucleótido diferente de detección se utiliza para detectar diferentes SNP heterocigotos.
11.

Método según la reivindicación 8, en donde el al menos un polinucleótido de detección específico de alelo hibrida con el ADNc extendido de manera dependiente delmolde a través de la posición polimórfica del SNP en el ADNc.
12.

Método según la reivindicación 11, en donde el al menos un polinucleótido de detección específico de alelo

comprende al menos o nucleótidos contiguos en el extremo 3’ del polinucleótido de detección específico de alelo, en 5 donde los almenos 8 nucleótidos contiguosson o bien:

100% complementarios a al menos 8 nucleótidos directamente 3’ o tienen 2 o 3 nucleótidos 3’ de la posición polimórfica de una región SNPmostrada en el al menos un SNP heterocigoto; o

100% idénticos a al menos 8 nucleótidos directamente o tienen 2 o 3 nucleótidos 5’ de la posición del al menos un SNP heterocigoto.

10 13. Método según la reivindicación 8, en donde el al menos un polinucleótido de detección específico de alelo comprende una secuencia 100% idéntica a al menos 8 nucleótidos contiguos, o el complemento de los mismos, de al menos un SNP heterocigoto, y la secuencia consiste en al menos 8 nucleótidos contiguos, o el complemento de los mismos, del SNP, en donde una de las posiciones de la secuencia corresponde a la posición variable del SNP.
14. Método según la reivindicación 4, que además comprende proporcionar una clasificación de riesgo de cáncer,

15 diagnóstico de cáncer, o pronóstico en base a la etapa de correlación, y/o someter al individuo a un procedimiento de detección de enfermedades (por ejemplo, colonoscopia) en base a la etapa de correlación, y/o someter una muestra del individuo a ensayos diagnósticos o pronósticos adicionales basados en la etapa de correlación, y/o cambiar un fármaco u otro régimen de tratamiento del individuo en base a la etapa de correlación.