ES2556580T3 - Genotipado a base de secuencias en base a ensayos de ligación a oligonucleótidos - Google Patents

Genotipado a base de secuencias en base a ensayos de ligación a oligonucleótidos Download PDF

Info

Publication number
ES2556580T3
ES2556580T3 ES12738652.2T ES12738652T ES2556580T3 ES 2556580 T3 ES2556580 T3 ES 2556580T3 ES 12738652 T ES12738652 T ES 12738652T ES 2556580 T3 ES2556580 T3 ES 2556580T3
Authority
ES
Spain
Prior art keywords
probes
sequence
target
probe
restricted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12738652.2T
Other languages
English (en)
Inventor
Michael Josephus Theresia Van Eijk
René Cornelis Josephus Hogers
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keygene NV
Original Assignee
Keygene NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keygene NV filed Critical Keygene NV
Application granted granted Critical
Publication of ES2556580T3 publication Critical patent/ES2556580T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Abstract

Procedimiento para la determinación de una secuencia de nucleótidos diana en una muestra que comprende las etapas de: (a) proporcionar para cada secuencia de nucleótidos diana (T) una primera sonda (P1) y una segunda sonda (P2), en el que la primera sonda comprende una primera sección específica de diana (TS1) y una primera sección etiqueta (TAG1) que es no complementaria a la secuencia de nucleótidos diana y que comprende opcionalmente una primera secuencia de unión a cebador (PBS1), en el que la primera sección etiqueta comprende una primera secuencia de reconocimiento (RE1) para una primera endonucleasa de restricción; en el que la segunda sonda comprende una segunda sección específica de diana (TS2) y una segunda sección etiqueta (TAG2) que es no complementaria a la secuencia de nucleótidos diana y que comprende una segunda secuencia de unión a cebador (PBS2) opcional, en el que la segunda sección etiqueta comprende una segunda secuencia de reconocimiento (RE2) para una segunda endonucleasa de restricción; (b) permitir que la primera y segunda sección específica de diana de la respectiva primera y segunda sonda se hibriden con la secuencia diana; (c) ligar la primera y segunda sonda cuando las secciones específicas de diana respectivas de las sondas se hibridan con secciones esencialmente adyacentes en la secuencia diana para proporcionar sondas ligadas (LP); (d) opcionalmente amplificar las sondas ligadas con un primer cebador opcional y/o un segundo cebador opcional para proporcionar amplicones (A); (e) restringir las sondas ligadas o amplicones con la primera y/o segunda endonucleasa de restricción para proporcionar sondas ligadas restringidas (RLP) o amplicones restringidos (RA), ligar un primer y/o un segundo adaptador que contiene un identificador de base adaptador (AD ID1, AD ID2) a las sondas ligadas restringidas (RLP) o amplicones restringidos (RA); (f) someter las sondas ligadas restringidas (RLP) ligadas a adaptador o amplicones restringidos (RA) ligados a adaptador a tecnología de secuenciación de alto rendimiento para determinar al menos parte de la secuencia de nucleótidos de las sondas ligadas restringidas o amplicones restringidos (g) identificar la presencia, ausencia o cantidad de la secuencia de nucleótidos diana en la muestra.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Genotipado a base de secuencias en base a ensayos de ligacion a oligonucleotidos Campo de la invencion
[0001] La presente invencion se refiere al campo de la biologfa molecular y la biotecnologfa. En particular, la presente invencion se refiere al campo de la deteccion de acido nucleico, mas en particular al diseno y composicion de (colecciones) de sondas que se pueden utilizar para la deteccion de alto rendimiento de acidos nucleicos. La presente invencion tambien se refiere a procedimientos para la deteccion de acidos nucleicos usando las sondas y composiciones. La presente invencion proporciona ademas sondas que son capaces de hibridarse a una secuencia diana de interes, cebadores para la amplificacion de sondas ligadas, uso de estas sondas y cebadores en la identificacion y/o deteccion de secuencias de nucleotidos que pueden estar relacionadas con una amplia variedad de caractensticas geneticas y genes. La presente invencion proporciona ademas kits de cebadores y/o sondas adecuados para su uso en el procedimiento segun la presente invencion. La presente invencion es aplicable en el campo de la deteccion de alto rendimiento de las secuencias de nucleotidos diana en muestras, ya sean de origen artificial, vegetal, animal o humano o combinaciones de los mismos. La presente invencion encuentra una aplicacion particular en el campo de genotipado de alto rendimiento.
Antecedentes de la invencion
[0002] Con el incremento exponencial cerca de la disponibilidad de informacion genetica debido al desarrollo de tecnologfas avanzadas para la obtencion de informacion sobre rasgos, alelos y secuenciacion, existe una creciente necesidad de ensayos eficientes, fiables y escalables para ensayar muestras y en muchos casos multiples muestras de una manera rapida, a menudo en paralelo. En particular, los polimorfismos de un solo nucleotido (SNP) contienen informacion valiosa sobre la composicion genetica de los organismos y la deteccion de los mismos es un campo que ha atrafdo un gran interes y actividad innovadora.
[0003] Uno de los procedimientos principales usados para el analisis de los acidos nucleicos de una secuencia conocida se basa en la hibridacion de dos sondas a una secuencia diana y, cuando las sondas se hibridan de forma adyacente a la secuencia diana, la ligacion de las sondas. La deteccion de un evento de ligacion con exito es entonces indicativo de la presencia de la secuencia diana en la muestra. En Ensayo de ligacion de oligonucleotidos (OLA) es una tecnologfa que se ha encontrado como adecuada para la deteccion de tales polimorfismos de nucleotido unico y se ha descrito a lo largo de los anos en muchas variaciones en un conjunto de solicitudes de patentes y artfculos cientfficos.
[0004] El principio OLA (Ensayo de ligacion de oligonucleotidos) se ha descrito, entre otros, en el documento US 4.988.617 (Landegren et al.). Esta publicacion da a conocer un procedimiento para determinar la secuencia de acido nucleico en una region de una secuencia de acido nucleico conocida que tiene una mutacion o polimorfismo conocido posible. Para detectar la mutacion, se seleccionan oligonucleotidos para hibridarse a segmentos inmediatamente adyacentes de la secuencia a determinar. Una de las sondas de oligonucleotidos seleccionadas tiene una region terminal en la que uno de los nucleotidos de la region terminal es complementario al nucleotido normal o mutado en la posicion correspondiente en la secuencia de acido nucleico conocida. Se proporciona una ligasa que conecta covalentemente las dos sondas cuando estan correctamente emparejadas de bases y estan situadas inmediatamente adyacentes entre sf. La presencia, ausencia o cantidad de las sondas unidas es una indicacion de la presencia de la secuencia y/o mutacion conocida. Otras variantes de tecnicas basadas en OLA se han descrito, entre otros, en Nilsson et al. Human mutation, 2002, 19, 410-415; Science 1994, 265: 2085-2088; US 5.876.924; WO 98/04745; WO 98/04746; US 6.221.603; US 5.521.065; US 5.962.223; EP 185494B1; US 6.027.889; US 4.988.617; EP 246864B1; US 6.156.178; EP 745140 B1; EP 964704 B1;WO 03/054511; US 2003/0119004; US 2003/190646; EP 1313880; US 2003/0032016; EP 912.761; EP 956359; US 2003/108913; EP 1255871; EP 1194770; EP 1252334; W0 96/15271; WO 97/45559; US 2003/0119004A1; US 5.470.705.
[0005] Otros avances en las tecnicas de OLA se han descrito por KeyGene, Wageningen, Pafses Bajos. En los documentos WO 2004/111271, WO 2005/021794, WO 2005/118847 y WO 03/052142, se han descrito varios procedimientos y disenos de sondas que mejoraban la fiabilidad de los ensayos de ligacion de oligonucleotidos. Estas aplicaciones describen ademas la mejora significativa en los niveles multiplex que se pueden conseguir. Tambien "SNPWave: a flexible multiplexed SNP genotyping technology", van Eijk MJ, Broekhof JL, van der Poel HJ, Hogers R.C., Geerlings H, Buntjer JB, van Oeveren Aj, Vos P Nucleic Acids Res. 2004; 32 (4): e47) describe las mejoras realizadas en este campo.
[0006] Con el inicio de las tecnologfas de Next Generation Sequencing (NGS), tal como se describe en Janitz Ed. Next Generation Genome sequencing, Wiley VCH, 2008 y disponible en el mercado en plataformas proporcionadas por Roche (GS FLX y sistemas relacionados) y lllumina (Genome Analyzer y sistemas relacionados), surgio la necesidad de adaptar el ensayo de OLA a la secuenciacion como plataforma de deteccion. Las mejoras en este campo se han descrito, entre otros, en el documento WO 2007100243 de Keygene NV. En WO2007100243, se ha descrito la aplicacion de la tecnologfa de secuenciacion de la siguiente generacion en los resultados de ensayos
5
10
15
20
25
30
35
40
45
50
55
60
65
de ligacion de oligonucleotidos.
[0007] Sigue existiendo la necesidad de nuevas mejoras en este campo, no solo desde el punto de vista de la fiabilidad y precision, sino tambien de los motores economicos para reducir aun mas los costes mediante el aumento de escala.
[0008] Existe una continua necesidad de sondas de oligonucleotidos que combinan las ventajas y evitan las desventajas espedficas de los diversos tipos de sondas de ligacion y procedimientos de deteccion conocidos en la tecnica. Tambien existe la necesidad de una nueva mejora de la tecnologfa proporcionando sondas que tienen ventajas adicionales. Uno de los objetivos de la presente invencion es proporcionar tales sondas y procedimientos. Otro objetivo de la presente invencion es evitar las desventajas de las sondas comunmente conocidas mencionadas anteriormente en el presente documento. Un objetivo adicional de la invencion es proporcionar sondas que sean adecuados para los procedimientos de deteccion de alto rendimiento. Tambien un objetivo de la presente invencion es proporcionar un procedimiento eficiente, fiable y/o de alto rendimiento para la deteccion de secuencias de nucleotidos diana mediante la realizacion de ensayos de ligacion de oligonucleotidos.
[0009] Los presentes inventores han establecido para eliminar o al menos disminuir los problemas existentes en la tecnica, mientras que al mismo tiempo se trata de mantener los muchos aspectos ventajosos de la misma, y para mejorar adicionalmente la tecnologfa. Otros problemas en la tecnica y soluciones aportadas a la misma por la presente invencion se pondran de manifiesto a lo largo de la descripcion, las figuras y las diversas realizaciones descritas en el presente documento.
Breve descripcion de los dibujos
[0010] La presente invencion se ilustra mediante las siguientes figuras:
Figura 1: En la Figura 1, los diferentes tipos de sondas (Figura 1A, Figura 1B, Figura 1C) se ilustran esquematicamente vis-a-vis una secuencia de nucleotidos diana (T) de interes. Se han representado diversos componentes de las sondas, utilizando representaciones identicas a lo largo de la figura.
La Figura 1A ilustra un ensayo de ligacion de oligonucleotidos general basado en un tipo de sonda lineal dirigido a una secuencia diana (T), en donde una primera sonda (P1) comprende una primera seccion espedfica de diana (TS1) y una primera seccion etiqueta (TAG1) que comprende un primer identificador (ID1) y una primera secuencia de union a cebador (PBS1), capaz de hibridar con un primer cebador (PR1). Una segunda sonda (P2) comprende una segunda seccion espedfica de diana (TS2) y una segunda seccion etiqueta (TAG2) que comprende un segundo identificador opcional (ID2) y una segunda secuencia de union a cebador (PBS2), capaz de hibridar con un segundo cebador (PR2). En realizaciones para la deteccion espedfica de alelo, TS2 puede contener, preferiblemente en su extremo 3', un nucleotido espedfico de alelo, preferiblemente junto con un identificador diferente (ID2) en la seccion de etiqueta. En otras realizaciones para la deteccion espedfica de alelo, TS1 puede contener, preferiblemente en su extremo 5', un nucleotido espedfico de alelo, preferiblemente junto con un identificador diferente (ID1) en la seccion de etiqueta. La combinacion de locus-alelo puede entonces determinarse (genotipado) mediante la deteccion de la presencia o ausencia de ID1 y/o ID2. De forma similar, todas las variantes alelicas de un polimorfismo se pueden genotipar (por ejemplo, 2 alelos de un polimorfism bialelico utilizando dos sondas con cada seccion diana espedfica de alelo o para 4 alelos, utilizando 4 secciones diana espedficas de alelo). Cuando la deteccion se basa en la secuenciacion, la deteccion de la presencia, ausencia o cantidad tambien puede basarse en la informacion de secuencia de las sondas ligadas mediante una combinacion de identificadores y la informacion de secuencia de la seccion espedfica de diana. Asf, el alelo se puede determinar a traves de la secuenciacion de (parte de la propia seccion diana, mientras que el locus se puede determinar por secuenciacion del identificador y viceversa).
La Figura 1B ilustra un ensayo de ligacion de oligonucleotido de acuerdo con la invencion basada en un tipo de sonda lineal dirigida a una secuencia diana (T). Las sondas se han equipado con una secuencia de reconocimiento para una endonucleasa de restriccion (RE1, RE2).
La Figura 1C ilustra un ensayo de ligacion de oligonucleotido de acuerdo con la invencion basada en un tipo de sonda lineal dirigida a una secuencia diana (T). Las sondas se han equipado con una secuencia de reconocimiento para una endonucleasa de restriccion (RE1, RE2) e identificadores (ID1, ID2).
La Figura 2 ilustra, en base a la configuracion de la sonda en la Figura 1B, que las dos sondas se hibridan con la secuencia diana y se ligan cuando la hibridacion se realiza correctamente. Dos rutas ahora abiertas, una en la que las sondas ligadas (LP) estan restringidas por una endonucleasa de restriccion, cuando sea necesario ayudada por el uso de adaptadores de horquilla u otros oligonucleotidos que proporcionan localmente una cadena ds que puede restringirse esencialmente como se describe en el presente documento en otro punto y se ilustra en la figura 5C. El resultado es una sonda ligada restringida (RLP). La otra ruta amplifica las sondas ligadas utilizando uno o mas cebadores (PR1, PR2) para producir amplicones (A) que pueden restringirse para producir amplicones restringidos (RA). A RLP y/o RA, se pueden ligar adaptadores que pueden contener identificadores (espedficos de muestra).Tanto RLP como Ra se pueden someter a secuenciacion, lo que da lugar a la identificacion de la presencia, ausencia y/o cantidad de la secuencia diana en la muestra. El genotipado (codominante) de la muestra se puede basar entonces en la identificacion de la secuencia diana en la muestra a traves de la informacion de secuencia a partir de (parte de) la seccion o secciones diana y/o identificadores proporcionadaos en las secciones de etiqueta.
La Figura 2A ilustra una realizacion en la que despues de la restriccion de los amplicones o sondas ligadas, se liga
5
10
15
20
25
30
35
40
45
50
55
60
65
un adaptador (AD1, AD2) que puede contener un identificador (AD1 ID1, AD2 ID2), cuyo identificador puede servir por ejemplo para identificar un origen de la muestra.
La Figura 3 ilustra una representacion esquematica de una serie de elementos que estan presentes en varias realizaciones de la invencion. Para facilitar la consulta se han relacionado con las indicaciones usadas anteriormente. Por lo tanto, TS representa una seccion espedfica de diana, ID indica un identificador, RE una secuencia de reconocimiento para una endonucleasa de restriccion. Un sitio de union del cebador se indica como PBS. Un adaptador que se liga a un fragmento restringido se representa como AD. Los cebadores utilizados en la etapa de amplificacion (ya sea para la amplificacion como parte de la preparacion de la biblioteca o como parte de la etapa de secuenciacion) se indican como PR. Los amplicones restringidos/sondas ligadas restringidas se indican como RA/RLA. Para indicar que ciertos elementos se utilizan en la secuenciacion del procedimiento de la invencion, esto puede indicarse por el prefijo SEQ. Por lo tanto, un adaptador utilizado en la etapa secuenciacion se puede indicar como "adaptador de secuenciacion” o SEQ AD. Cuando dos o mas elementos estan presentes al mismo tiempo, esto se indica con un sufijo numerico. Por lo tanto, ID1 es el primer identificador, ID2 es el segundo y asf sucesivamente.
La Figura 3A ilustra una sonda ligada tfpica de acuerdo con la invencion que comprende sitios de union a cebadores (PBS1, PBS2), sitios de reconocimiento para endonucleasas de restriccion (RE1, RE2), identificadores (ID1, ID2), secciones espedficas de diana (TS1, TS2) y cebadores para amplificacion (PR1, PR2)
La Figura 3B ilustra una serie de las diversas posibilidades donde identificadores pueden situarse en las sondas, amplicones y fragmentos ligados a adaptadores de la invencion. Los identificadores pueden estar presentes independientemente, o combinados. La secuencia espedfica diana tambien puede servir como un identificador en el procedimiento para la genotipificacion basado en la secuencia, el locus (L) y el alelo (Al) tambien se indican aqu como posibles identificadores. Por ejemplo, el alelo puede representarse por un identificador (1) y el locus por la secuencia de la seccion diana (1). Tanto el alelo como el locus pueden representarse por un identificador (2). O el locus esta representado por un identificador y el alelo por una seccion espedfica de diana (3). La muestra puede representarse por un identificador, independientemente de la representacion del alelo y/o locus (5). Las variaciones 6, 7, 8 y 9 muestran varias combinaciones de identificadores que pueden servir para fines distintos o identicos. Otras variaciones son posibles y son equivalentes a las posibilidades que se muestran actualmente.
La Figura 4 ilustra varias realizaciones para la secuenciacion de los fragmentos de la invencion. Como las sondas ligadas (amplificadas) se han restringido utilizando las endonucleasas de restriccion, los amplicones restringidos/sondas ligadas restringidas se indican como RA/RLP (y por lo tanto contienen la informacion del locus y el alelo, L y Al, respectivamente). Despues de la restriccion, se han anadido adaptadores (AD1, AD2) que puede ser adaptadores de secuenciacion (SEQ AD1, SEQ AD2) que se pueden utilizar en la etapa de secuenciacion (se conocen ejemplos en la tecnica como cebadores P5/P7 (lllumina). Los cebadores utilizados en la etapa de secuenciacion (cebadores de secuenciacion) se indican como SEQ PR1, SEQ PR2 y son complementarios a las secciones (secuencias de union a cebadores) en los adaptadores de secuenciacion.
La Figura 4A ilustra la secuenciacion de lectura unica (I) desde un extremo o desde el extremo opuesto y la secuenciacion de extremos emparejado (I y II combinadas). El fragmento de secuenciacion, que comprende RA/RLP y que comprende ademas uno o mas identificadores (ID, L, Al) esta secuenciado en una direccion (flecha rayada), usando un cebador de secuenciacion que conduce a (dependiendo de la longitud de lectura generada por la plataforma de secuenciacion) una lectura que identifica la presencia/ausencia o cantidad de la secuencia diana proporcionando la secuencia del identificador y, opcionalmente, (parte de) RA/RLP. La lectura producida mediante I proporciona principalmente informacion de la secuencia del adaptador (incluyendo el ID), II principalmente de la secuencia diana y III de ambos, siempre que la lectura sea lo suficientemente larga, dependiendo de la plataforma.
La Figura 4B ilustra la secuenciacion de doble etiqueta unidireccional. La sonda ligada restringida o el amplicon restringido (RA/RLP) se han ligado a dos adaptadores de secuenciacion y se han secuenciado en una direccion pero con dos cebadores (SEQ PR1, PR2 SEQ). Los dos cebadores dan lugar a dos lecturas diferentes, una lectura corta y una lectura larga. La secuenciacion proporciona al menos informacion de la secuencia de los identificadores (tanto para la lectura corta como para la lectura larga) y la secuencia de (parte de) RLP/AR, posiblemente incluyendo L y Al.
La Figura 4C ilustra una realizacion en la que se realiza una etapa de reagrupamiento. Los fragmentos de secuenciacion se secuencian en una direccion que da lugar a la primera lectura (Long1). El fragmento de secuenciacion se reagrupado mediante hibridacion del otro adaptador de secuenciacion al portador en el que se realiza la secuenciacion. El fragmento es secuenciado desde el otro extremo, lo que da lugar a otra lectura larga (Long 2).
La Figura 4D ilustra una realizacion que es una combinacion de la realizacion descrita en las figuras 4B y 4C. Por lo tanto, primero un procedimiento de secuenciacion de doble etiqueta unidireccional es seguido por el reagrupamiento y la secuenciacion del fragmento de la otra direccion, dando lugar a la combinacion de dos lecturas largas y una lectura corta.
La Figura 5 ilustra el uso de un adaptador en forma de Y.
La Figura 5A muestra un adaptador en forma de Y en el que el adaptador en los brazos de la Y puede contener diferentes elementos, tales como identificadores, adaptadores de secuenciacion, sitios de union a cebadores, etc. Uno de los brazos de la Y es por lo tanto diferente del otro brazo de la Y. La parte inferior de la forma Y tiene doble cadena (es decir, contiene cadenas complementarias) y ambas cadenas son capaces de ligarse al fragmento de restriccion. Esta realizacion se puede utilizar cuando solo un sitio de reconocimiento ha sido introducido en las dos secciones etiqueta de las dos sondas, se necesita solo un adaptador para ligar los adaptadores a ambos lados de un fragmento de restriccion, tal como una RLA o un RA (ver I). La autoligacion del adaptador en forma de Y se muestra
5
10
15
20
25
30
35
40
45
50
55
60
65
en la Figura 5A II.
La Figura 5B muestra como evitar la autoligacion de los adaptadores en forma de Y representados en la Figura 5A
(II). El extremo de hibridacion del adaptador se puede disenar para ligar una sola cadena. La otra cadena tiene un hueco, evitando la ligacion. Esto se ilustra por un extremo escalonado en el fragmento de CTA, combinado con un saliente en el Y de solo el GA. Esto evita la autoligacion.
La Figura 5C ilustra algunas de las realizaciones de la invencion en las que la cadena unica de la sonda ligada se restringe utilizando un oligonucleotido adicional o mediante la ligacion de una sonda de horquilla. Ambas realizaciones proporcionan cadenas que se pueden cortar por una endonucleasa de restriccion.
La Figura 6 ilustra el procedimiento de secuenciacion de pares acoplados (“mate pair”), que comprende una etapa de circularizacion y una etapa en la que los dos extremos del fragmento estan unidos y, despues de la fragmentacion y la ligacion de adaptadores, son posteriormente secuenciados juntos.
Caracteristicas de la invencion
[0011] Los presentes inventores han sido capaces de combinar nuevas tecnologfas de secuenciacion de alto rendimiento con la versatilidad de ensayos basados en la ligacion de oligonucleotidos. En particular, la invencion se refiere a un procedimiento para la deteccion de alto rendimiento de secuencias de nucleotidos diana en base a ensayos de ligacion de oligonucleotidos, en los que las sondas utilizadas en los ensayos de ligacion se modifican de tal manera que se puede utilizar un procedimiento de secuenciacion de alto rendimiento para revelar inequvocamente la presencia/ausencia de la cantidad de dichas una o mas secuencias de nucleotidos diana. Los inventores han descubierto que se pueden hacer mejoras mediante la adaptacion de los procedimientos existentes para centrarse en la deteccion de las partes del producto de ligacion que son relevantes para una deteccion adecuada de las secuencias diana en una pluralidad de muestras. El procedimiento se basa en el uso de (combinaciones de) identificadores basados en la secuencia en combinacion con una etapa que reduce la cantidad de datos de secuencia no relevantes mediante la eliminacion (recorte) de una parte de las sondas (ligadas) antes de la secuenciacion. El uso de adaptadores (que pueden contener identificadores) que estan conectados a las sondas ligadas restringidas o sondas ligadas amplificadas permite el uso de conjuntos genericos de adaptadores e identificadores y cebadores en combinacion con sondas deliberadamente disenadas para secuencias diana. La estrategia modular, que separa los elementos de la sonda que estan conectados a la propia diana y los elementos que estan conectados a muestras multiplex y la deteccion basada en secuencias permite una flexibilidad ventajosa en combinacion con una fiabilidad probada. La presente invencion conduce a procedimientos ventajosos para el genotipado de alto rendimiento de grandes cantidades de muestras para un gran numero de genotipos con alta precision y bajo coste por punto de dato. La presente invencion tambien permite adaptar la tecnologfa OLA demostrada a las nuevas plataformas de deteccion basadas en la secuenciacion.
Descripcion detallada de la invencion
[0012] La presente invencion en su forma mas amplia se refiere a un procedimiento para la deteccion de una secuencia de nucleotidos diana en una muestra basado en un ensayo de ligacion de oligonucleotidos en el que se usan sondas que se proporcionan con o contiene (una combinacion de) identificadores basados en la secuencia que pueden identificar la muestra y/o la secuencia diana (es decir, combinacion de locus y/o alelo) en el que despues de la etapa de ligacion, las sondas ligadas, o despues de la amplificacion, las sondas ligadas amplificadas, se restringen usando enzimas de restriccion para cortar parte de las sondas, en caso necesario, se ligan al identificador que contiene adaptadores y continuan con aquellas partes (identificadores y/o secuencia diana) que contienen la informacion relevante en la etapa de secuenciacion para la identificacion adecuada de la muestra y/o genotipo basado en la presencia y/o ausencia de identificador o identificadores.
[0013] Por lo tanto, con mas detalle, la invencion se refiere a un procedimiento para la determinacion de una secuencia de nucleotidos diana en una muestra que comprende las etapas de
(a) proporcionar para cada secuencia de nucleotidos diana (T) una primera sonda (P1) y una segunda sonda (P2), en el que la primera sonda comprende una primera seccion espedfica de diana (TS1) y una primera seccion etiqueta (TAG1) que es no complementaria a la secuencia de nucleotidos diana y que comprende opcionalmente una primera secuencia de union a cebador (PBS1), en el que la primera seccion etiqueta comprende una primera secuencia de reconocimiento (RE1) para una primera endonucleasa de restriccion; en el que la segunda sonda comprende una segunda seccion espedfica de diana (TS2) y una segunda seccion etiqueta (TAG2) que es no complementaria a la secuencia de nucleotidos diana y que comprende una segunda secuencia de union a cebador (PBS2) opcional, en el que la segunda seccion etiqueta comprende una segunda secuencia de reconocimiento (RE2) para una segunda endonucleasa de restriccion;
(b) permitir que la primera y segunda seccion espedfica de diana de la respectiva primera y segunda sonda se hibriden con la secuencia diana;
(c) ligar la primera y segunda sonda cuando las secciones espedficas de diana respectivas de las sondas se hibridan con secciones esencialmente adyacentes en la secuencia diana para proporcionar sondas ligadas (LP);
(d) opcionalmente amplificar las sondas ligadas con un primer cebador opcional y/o un segundo cebador opcional para proporcionar amplicones (A);
(e) restringir las sondas ligadas o amplicones con la primera y/o segundo endonucleasa de restriccion para proporcionar sondas ligadas restringidas (RLP) o amplicones restringidos (RA), ligar un primer y/o un segundo
5
10
15
20
25
30
35
40
45
50
55
60
65
adaptador que contiene un identificador de base adaptador (AD ID1, AD ID2) a las sondas ligadas restringidas (RLP) o amplicones restringidos (RA)
(f) someter las sondas ligadas restringidas (RLP) ligadas a adaptador o amplicones restringidos (RA) ligados a adaptador a tecnologfa de secuenciacion de alto rendimiento para determinar al menos parte de la secuencia de nucleotidos de las sondas ligadas restringidas o amplicones restringidos
(g) identificar la presencia, ausencia o cantidad de la secuencia de nucleotidos diana en la muestra.
[0014] El procedimiento comienza con la disposicion de una o mas muestras (que pueden estar combinadas o agrupadas) que pueden contener (o se sospecha que contienen) la secuencia de nucleotidos diana (secuencia de interes). A esta muestra, se anade el conjunto (de una primera y una segunda sonda) de sondas (para cada secuencia diana, se pueden proporcionar diferentes conjuntos de sondas) y se deja que las secciones espedficas de diana de las sondas se hibriden a la secuencia diana bajo condiciones adecuadas. Despues de la hibridacion, cualquier sonda hibridada esencialmente adyacente en la secuencia diana se ligan para dar lugar a sondas ligadas. Las sondas ligadas se pueden amplificar o, alternativamente, someter directamente a secuenciacion usando procedimientos de secuenciacion de alto rendimiento. Con la etapa de secuenciacion, se determina la presencia de la secuencia diana (espedfico de alelo) en la muestra y se pueden determinar los genotipos.
[0015] Un aspecto de la presente invencion se refiere al diseno ventajoso de las sondas utilizadas en la presente invencion. Estas sondas se discutiran en mas detalle en este documento a continuacion. Otro aspecto ventajoso de la invencion reside en la conexion entre las tecnologfas de secuenciacion de alto rendimiento del estado de la tecnica como una plataforma de deteccion para los ensayos de ligacion de oligonucleotidos y el poder discriminatorio de los ensayos basados en OLA. Los presentes inventores han observado que, aparte de innovaciones en el diseno de la sonda, tambien los procedimientos para realizar ensayos de OLA en combinacion con secuenciacion de alto rendimiento requieren modificaciones considerables para sondas y protocolos.
[0016] En la etapa (a) del procedimiento para cada secuencia de nucleotidos diana (T) en la muestra (S) se proporciona un conjunto de sondas. El conjunto de sondas puede comprender una primera sonda (P1) y una segunda sonda (P2).
[0017] La primera sonda comprende una primera seccion espedfica de diana (TS1) y una primera seccion etiqueta (TAG1). La primera seccion etiqueta no es complementaria a la secuencia de nucleotidos diana, es decir, esta compuesta de una secuencia de nucleotidos que no se hibrida o une a la secuencia diana bajo condiciones de rigurosidad empleadas para la hibridacion de la seccion espedfica de secuencia diana. En deltas realizaciones, la primera sonda comprende una seccion espedfica de diana en su extremo 3'. La primera seccion etiqueta puede comprender ademas una primera secuencia de union a cebador (PBS1). La primera secuencia de union a cebador es capaz de unirse a un cebador (PR1).
[0018] La segunda sonda comprende una segunda seccion espedfica de diana (TS2) y una segunda seccion etiqueta (TAG2). La segunda seccion etiqueta no es complementaria a la secuencia de nucleotidos diana, es decir, esta compuesta de una secuencia de nucleotidos que no se hibrida o une a la secuencia diana bajo condiciones de rigurosidad empleadas para la hibridacion de la seccion espedfica de secuencia diana. En ciertas realizaciones, la segunda sonda comprende una segunda seccion espedfica de diana en su extremo 5'. La segunda seccion etiqueta puede comprender ademas una segunda secuencia de union a cebador (PBS2). La segunda secuencia de union a cebador (si esta presente) es capaz de unirse a un cebador (PR2).
[0019] Al menos una de las secciones etiqueta contiene una secuencia de reconocimiento para una endonucleasa de restriccion. La primera y/o la segunda seccion etiqueta puede comprender, independientemente, una primera y/o una segunda secuencia de reconocimiento (RE1, RE2) para una primera y/o segunda endonucleasa de restriccion. La primera y la segunda secuencia de reconocimiento pueden ser la misma o diferente (es decir, RE1 = RE2 o RE1 * RE2) entre sf. Existe una preferencia para lan endonucleasas de restriccion que tienen dos secuencias de reconocimiento diferentes (RE1 * RE2). La secuencia de reconocimiento se encuentra entre el sitio de union a cebador (si esta presente) y la seccion espedfica de diana. La primera secuencia de reconocimiento puede estar situada entre la primera secuencia de union a cebador opcional y la primera seccion espedfica de diana. La segunda secuencia de reconocimiento puede estar situada entre la segunda secuencia de union a cebador (si esta presente) y la segunda seccion espedfica de diana.
[0020] Las primera y segunda secciones espedficas de diana respectivas de las sondas se dejan hibridar con secciones preferiblemente esencialmente adyacentes en la secuencia diana, aunque en algunas realizaciones puede estar presente un hueco de uno o mas nucleotidos entre las dos secciones (ligacion de huecos, vease, por ejemplo WO2007/100243, WO00/77260, US5185243, EP439182 y mas a continuacion).
[0021] En ciertas realizaciones, la primera y segunda sondas estan ligadas, es decir, estan conectadas entre sf. Las sondas se ligan entre sf esencialmente cuando se hibridan (o unen) la respectiva seccion diana (primera, segunda) a secciones esencialmente adyacentes en la secuencia diana. La ligacion de la primera y segunda sonda proporciona sondas ligadas (LP).
5
10
15
20
25
30
35
40
45
50
55
60
65
[0022] Las sondas ligadas (LP) ahora se:
i) . restringen con la primera y/o segunda endonucleasa de restriccion que es capaz de reconocer la primera y/o segunda secuencia de reconocimiento de la endonucleasa de restriccion para proporcionar sondas ligadas restringidas (RLP) (esto puede requerir el uso de oligonucleotidos complementarios y/o sondas en horquilla o el uso de endonucleasas de ssDNA, tal como se describe aqu en otros puntos); o
ii) . amplifican (lineal o exponencial) con un primer cebador y/o un segundo cebador opcional para dar lugar a amplicones (A) y a continuacion se restringen con la primera y/o segunda endonucleasa de restriccion que es capaz de reconocer la secuencia de reconocimiento de la endonucleasa de restriccion para proporcionar amplicones restringidos (RA).
[0023] Mediante el tratamiento de las sondas ligadas con una o mas endonucleasas de restriccion, las sondas ligadas restringidas se han liberado de partes de la seccion etiqueta. Esto reduce significativamente la longitud de las sondas ligadas y, por consiguiente, la cantidad de datos producidos mejora la adaptabilidad de la tecnologfa de ensayos de ligacions de oligonucleotidos para el uso de estrategias de secuenciacion de alto rendimiento que prefieren lecturas mas cortas. Las sondas ligadas restringidas comprenden los restos de la primera y/o la segunda secuencia de reconocimiento de la endonucleasa de restriccion, la primera y la segunda seccion complementaria diana. Las sondas ligadas restringidas pueden contener ademas uno o mas identificadores basados en la secuencia (ID), esencialmente tal como se explica en este documento a continuacion. Para ayudar en el tratamiento de las sondas ligadas con endonucleasas de restriccion, los oligonucleotidos adicionales se pueden proporcionar de manera que pueden hibridarse con las sondas ligadas en las posiciones de los sitios de restriccion y/o reconocimiento para proporcionar sitios de restriccion y/o reconocimiento de doble cadena. Alternativamente, las sondas de forma de horquilla se pueden ligar a las sondas ligadas que cubren las posiciones de los sitios de restriccion y/o de reconocimiento para proporcionar sitios de restriccion y/o reconocimiento de doble cadena que posteriormente se pueden restringir. Alternativamente, la primera y/o las propias sondas pueden contener una estructura de horquilla a tal efecto.
[0024] Los amplicones restringidos (o sondas ligadas restringidas) se someten ahora a la tecnologfa de secuenciacion de alto rendimiento, esencialmente tal como se describe en el presente documento a continuacion para determinar al menos parte de la secuencia de nucleotidos de los amplicones restringidos o sondas ligadas restringidas. En ciertas realizaciones, se determina al menos parte de la seccion espedfica de diana. En ciertas realizaciones, cuando se han incorporado identificadores en las sondas, tal como se explica en mas detalle a continuacion, y por lo tanto, en las sondas ligadas restringidas o amplicones restringidos, se determina al menos la secuencia de uno o mas de los identificadores. En ciertas realizaciones preferidas, se determina una combinacion de la seccion espedfica de diana (informacion de alelo y/o locus) y dichos uno o mas identificadores.
[0025] Mediante la determinacion de la secuencia de los identificadores y/o al menos parte de la seccion espedfica de diana, se identifica la presencia, ausencia o cantidad de la secuencia diana en la muestra.
Secuencia de nucleotidos diana
[0026] En su definicion mas amplia, la secuencia diana puede ser cualquier secuencia de nucleotidos de interes. La secuencia diana puede ser cualquier secuencia de la que se desea la determinacion/deteccion, por ejemplo porque es indicativa, esta asociada o es representativa de una determinada dolencia o constitucion o trastorno genetico. La secuencia diana preferiblemente es una secuencia de nucleotidos que contiene, representa o esta asociada con un polimorfismo.
[0027] Tal como se utiliza en el presente documento, el termino "polimorfismo" se refiere a la presencia de dos o mas variantes de una secuencia de nucleotidos en una poblacion. Un polimorfismo puede comprender uno o mas cambios de bases, una insercion, una repeticion, o una delecion. Un polimorfismo incluye, por ejemplo, una repeticion de secuencia simple (SSR) y un polimorfismo de un solo nucleotido (SNP), que es una variacion, que se producen cuando se altera un solo nucleotido: adenina (A), timina (T), citosina (C) o guanina (G). Una variacion generalmente debe ocurrir en al menos el 1% de la poblacion para ser considerado un SNP. Los SNP componen, por ejemplo, el 90% de todas las variaciones geneticas humanas, y se producen cada 100 a 300 bases a lo largo del genoma humano. Dos de cada tres SNP sustituyen citosina (C) por Timina (T). Las variaciones en las secuencias de ADN de, por ejemplo, los seres humanos o plantas pueden afectar a la manera en que se tratan enfermedades, bacterias, virus, productos qmmicos, farmacos, etc.
[0028] Un marcador o sitio polimorfico es el locus en el que se produce la divergencia de secuencia. Los marcadores preferidos tienen al menos dos alelos, produciendose cada uno a una frecuencia mayor del 1%, y mas preferiblemente mayor del 10% o 20% de una poblacion seleccionada. Un locus polimorfico puede ser tan pequeno como un par de bases. Los marcadores polimorficos incluyen polimorfismos de la longitud del fragmento de restriccion, numero variable de repeticiones en tandem (VNTR), regiones hipervariables, minisatelites, repeticiones de dinucleotidos, repeticiones de trinucleotidos, repeticiones de tetranucleotidos, repeticiones de secuencia simple, (elementos de) Quantitative Trait Loci, y elementos de insercion, tales como Alu. La primera forma alelica identificada se designa arbitrariamente como la forma de referencia (tipo salvaje) y otras formas alelicas son designadas como alelos alternativos o variantes. La forma alelica que se produce con mayor frecuencia en una
5
10
15
20
25
30
35
40
45
50
55
60
65
poblacion seleccionada se refiere a veces como la forma tipo salvaje. Los organismos diploides (y tetraploides/hexaploides) pueden ser homocigotos o heterocigotos para las formas alelicas. Un polimorfismo dialelico tiene dos formas. Un polimorfismo trialelico tiene tres formas. Un polimorfismo de un solo nucleotido se produce en un sitio polimorfico ocupado por un unico nucleotido, que es el sitio de variacion entre secuencias alelicas. El sitio esta normalmente precedido de y seguido por secuencias altamente conservadas del alelo (por ejemplo, secuencias que vanan en menos de 1/100 o 1/1000 miembros de las poblaciones). Un polimorfismo de un solo nucleotido habitualmente surge debido a la sustitucion de un nucleotido por otro en el sitio polimorfico. Los polimorfismos de un solo nucleotido tambien pueden surgir de una delecion de un nucleotido o una insercion de un nucleotido con relacion a un alelo de referencia. Otros polimorfismos incluyen (pequenas) deleciones o inserciones de varios nucleotidos, conocidos como indels. El proceso de analisis de las variaciones geneticas particulares (polimorfismos) existentes en una muestra de ADN individual usando los procedimientos actualmente descritos se refiere a veces en esta solicitud como genotipado o genotipado de SNP en el as de polimorfismos de un solo nucleotido. El procedimiento de la presente invencion permite el genotipado codominante utilizando un conjunto de sondas para cada alelo. Esta realizacion es ventajosa en el caso de muestras heterocigoticas.
[0029] Tal como se utiliza en el presente documento, el termino "alelo" o “alelos” significa cualquiera de una o mas formas alternativas de un gen en un locus particular. En una celula diploide de un organismo, los alelos de un gen determinado se encuentran en una ubicacion espedfica, o locus (loci en plural) en un cromosoma. Un alelo esta presente en cada cromosoma del par de cromosomas homologos. Un diploide, o especie de plantas, pueden comprender un gran numero de diferentes alelos en un locus particular. El locus de adhesiones de tipo salvaje puede, por lo tanto, comprender diversos alelos, que pueden variar ligeramente en la secuencia de nucleotidos y/o la secuencia de aminoacidos codificada.
[0030] Tal como se utiliza en el presente documento, el termino "locus" (loci en plural) significa un lugar o lugares espedficos o un sitio en un cromosoma donde por ejemplo se encuentra un gen o marcador genetico. Por ejemplo, el "locus" se refiere a la posicion en el genoma donde se encuentran el gen (y los correspondientes alelos).
Muestra
[0031] Una muestra puede contener al menos una secuencia diana y, en principio, el procedimiento de la presente invencion se puede ejecutar en una muestra que contiene una secuencia diana (“muestra unica - monoplex”). Se prefiere que una muestra contenga dos o mas secuencias diana diferentes (“muestra unica - multiplex”), es decir, dos o mas se refiere a la identidad en lugar de la cantidad de las secuencias diana en la muestra. En particular, la muestra comprende al menos dos secuencias diana diferentes, en particular al menos 100, preferiblemente al menos 250, mas preferiblemente al menos 500, mas en particular al menos 1000, preferiblemente al menos 2.500, mas preferiblemente al menos 5.000 y lo mas preferiblemente al menos 10.000 secuencias diana adicionales. En la practica, el numero de secuencias diana en una muestra que puede ser analizada esta limitado, entre otros, por el numero de amplicones o sondas ligadas que pueden ser detectados. Los procedimientos de deteccion actualmente empleados permiten grupos relativamente grandes de secuencias diana. La muestra se puede aislar directamente de un individuo o grupo de individuos o puede derivarse de los mismos, tales como ADNc, plasmidos, YAC, BAC, cosmidos, bibliotecas de cromosomas artificiales, etc.
Pluralidad de muestras
[0032] En ciertas realizaciones, se pueden analizar una pluralidad de muestras usando el procedimiento de la invencion. Cada muestra se puede derivar de un origen diferente, por ejemplo, diferentes pacientes que tienen que ser examinados para la presencia o ausencia de ciertas disposiciones geneticas para ciertas dolencias. O las muestras se pueden derivar de la progenie de un cruce para cribar diferentes polimorfismos. El presente procedimiento se puede utilizar para analizar al menos dos muestras diferentes, en particular al menos 100, preferiblemente al menos 250, mas preferiblemente al menos 500, mas en particular al menos 1.000, preferiblemente al menos 2.500, mas preferiblemente al menos 5.000 y lo mas preferiblemente al menos 10.000 muestras para la ausencia o presencia de una (“monoplex-monoplex”) o mas o una pluralidad (“multiplex-multiplex”) de secuencias diana. Las muestras se pueden distinguir en el procesamiento adicional del procedimiento utilizando uno o mas (combinaciones de) identificadores tal como se describe en el presente documento en otros lugar.
ADN
[0033] En la muestra (acido nucleico), los acidos nucleicos que comprenden la secuencia de nucleotidos diana puede ser cualquier acido nucleico de interes. A pesar de que los acidos nucleicos en la muestra estaran habitualmente en forma de ADN, la informacion de la secuencia de nucleotidos contenida en la muestra puede ser de cualquier fuente de acidos nucleicos, incluyendo por ejemplo ARN, ARN poliA +, ADNc, ADN genomico, ADN organular, tal como ADN mitocondrial o de cloroplastos, acidos nucleicos sinteticos, bibliotecas de ADN (tales como bibliotecas BAC/clones BAC agrupados), bancos clonales o cualquier seleccion o combinaciones de los mismos. El ADN de la muestra puede ser de doble cadena, de cadena sencilla y ADN de doble cadena desnaturalizado en ADN de una sola cadena. La desnaturalizacion de secuencias de doble cadena produce dos fragmentos de cadena sencilla, una o ambas pueden analizarse por sondas espedficas para las cadenas respectivas. Las muestras de
5
10
15
20
25
30
35
40
45
50
55
60
65
acido nucleico preferidas comprenden secuencias diana en ADNc, ADN genomico, fragmentos de restriccion, fragmentos de restriccion ligados a adaptadores, fragmentos de restriccion ligados a adaptadores amplificados, fragmentos AFLP® o fragmentos obtenidos en una preamplificacion de plantilla de AFLP.
Sonda
[0034] Las secciones de las sondas de oligonucleotidos que son complementarias a la secuencia diana se disenan de tal manera que para cada secuencia diana en una muestra, se proporciona un par de una primera y una segunda sonda, mediante lo cual las sondas contienen cada una contienen una seccion en su extremo que es complementaria a una parte de la secuencia diana (una primera y una segunda parte de la secuencia diana, respectivamente) y las partes complementarias correspondientes de la secuencia diana se encuentran preferiblemente esencialmente adyacentes entre st
[0035] En ciertas realizaciones, se pueden proporcionar la primera y/o la segunda sondas adicionales, correspondientes a diferentes alelos de un locus. En ciertas realizaciones, el nucleotido espedfico de alelo se encuentra en la posicion de la primera o la segunda sonda en la que se produce la ligacion, es decir, en el extremo de la seccion espedfica de diana.
[0036] En ciertas realizaciones, dentro de un par de sondas de oligonucleotidos, la primera sonda de oligonucleotidos tiene una seccion en su extremo 5' (fosforilado) que es complementaria a una primera parte de una secuencia diana y la segunda sonda de oligonucleotidos tiene una seccion en su extremo 3' (hidroxilo) que es complementaria a una segunda parte de la secuencia diana. De este modo, cuando el par de sondas se hibridan con partes complementarias de una secuencia diana, el extremo 5' de la primera sonda de oligonucleotidos es esencialmente adyacente al extremo 3' de la segunda sonda de oligonucleotidos de tal manera que los extremos respectivos de las dos sondas pueden ligarse para formar un enlace fosfodiester o conectarse covalentemente en cualquier otra forma adecuada. En ciertas realizaciones, dentro de un par de sondas de oligonucleotidos, la primera sonda de oligonucleotidos tiene una seccion en su extremo 3' que es complementaria a una primera parte de una secuencia diana y la segunda sonda de oligonucleotidos tiene una seccion en su extremo 5' que es complementaria a una segunda parte de la secuencia diana. De este modo, cuando el par de sondas se hibrida con partes complementarias de una secuencia diana, el extremo 3' de la primera sonda de oligonucleotidos es esencialmente adyacente al extremo 5' de la segunda sonda de oligonucleotidos de tal manera que los extremos respectivos de las dos sondas se pueden ligar para formar un enlace fosfodiester o conectarse de forma covalente en otra forma adecuada.
[0037] Para la deteccion espedfica de alelo, se prefiere que la sonda espedfica de alelo tenga su seccion espedfica de diana en el extremo 3' de la sonda. Al contrario, la sonda espedfica de alelo en el extremo 5' de la sonda es menos preferida.
[0038] En ciertas realizaciones, para cada secuencia diana para la que se determina la presencia, ausencia o cantidad en una muestra, se disena un par espedfico de primera y segunda sondas de oligonucleotidos, cada sonda con una seccion complementaria a la parte complementaria adyacente de cada secuencia diana, tal como se describe anteriormente. Por lo tanto, en el procedimiento de la invencion, para cada secuencia diana que esta presente en una muestra, se puede obtener una sonda ligada o un amplicon (espedfico) correspondiente en la muestra amplificada. En ciertas realizaciones, se proporciona una multiplicidad de primera y segunda sondas de oligonucleotidos complementarias a una multiplicidad de secuencias diana en una muestra. Un par de primera y segunda sondas de oligonucleotidos para una secuencia diana determinada en una muestra diferira al menos en la secuencia de nucleotidos de pares de sondas para otras secuencias diana u otras muestras, y pueden diferir en la longitud y/o la masa de pares de sondas para otras dianas (aunque, como se ha senalado anteriormente, esto es menos preferido). Mas preferiblemente, un par de sondas para una diana determinada producira una sonda ligada (a veces indicada como sonda conectada) y/o amplicon que difiere en la secuencia de sondas ligadas y/o amplicones correspondientes a otras dianas en la muestra.
[0039] Existe un numero de variaciones posibles de la sonda dentro del alcance de la presente invencion que se pueden utilizar como alternativas a la primera y segunda sonda (a veces indicadas como "sondas lineales ') descritas en el presente documento. Los ejemplos se denominan sondas candado (“padlock”) y sondas de “key lock”. Estas variantes de sonda se pueden utilizar indistintamente, es decir, se pueden utilizar en un ensayo combinaciones de sondas lineales, sondas candado y Keylock.
Sondas candado
[0040] En ciertas realizaciones de la invencion, se pueden utilizar sondas circularizables o sondas candado. Las primera y segunda sondas se combinan a continuacion en una sonda. La sonda circularizable es un oligonucleotido lineal que, cuando se hibrida con la secuencia diana, y cuando se liga, tiene una conformacion circular que esta topologicamente bloqueada a la secuencia diana. En ciertas realizaciones, un tratamiento con exonucleasa de la muestra despues de la etapa de ligacion y antes de la amplificacion, preferiblemente amplificacion por PCR, sirve para eliminar cualquier sonda circular no ligada y para evitar la amplificacion de cualquier sonda no ligada. Las
5
10
15
20
25
30
35
40
45
50
55
60
65
sondas circularizables son en sf mismos conocidas en la tecnica, por ejemplo de EP745140 o de Van Eijk et al, Nucleic Acids Research, 2004, 32, E47. Las sondas candado conocidas se amplifican habitualmente mediante amplificacion por drculo rodante o la reaccion en cadena de la polimerasa dando lugar a concatameros. Ademas, los sitios de union al cebador en las sondas circularizables conocidas estan orientados de tal manera que la sonda circularizada completa se amplifica incluyendo cualquier secciones espedfica de diana. Con el fin de evitar productos concatameros durante la amplificacion por PCR, se puede incorporar una modificacion de bloqueo en la sonda de ligacion circularizable entre los dos sitios de union a cebador del tipo descrito en el documento WO03/052142. En ciertas realizaciones, los sitios de union a cebador en las presentes sondas circularizables estan orientados de tal manera que preferiblemente solo la seccion que comprende los sitios de union a cebador y el identificador se amplifican y preferiblemente las secciones espedficas de diana ligadas no se amplifican. Preferiblemente, en combinacion con el tratamiento con exonucleasa para eliminar las sondas circularizables no ligadas, esto proporciona amplicones de longitud relativamente corta en comparacion con amplicones convencionales obtenidos a partir de sondas circularizadas convencionalmente amplificantes. Esto evita la formacion de grandes concatameros y la posterior amplificacion innecesaria de la sonda circularizada completa. En ciertas realizaciones, el identificador se encuentra esencialmente adyacente a una de las secuencias de union a cebador, y preferiblemente entre el primer y el segundo sitio de union a cebador, de manera que tras la amplificacion de los amplicones comprende al menos uno de los dos sitios de union a cebador y el identificador intermitente. Dicho al menos uno, preferiblemente dos sitios de reconocimiento de la endonucleasa de restriccion estan situados preferiblemente de manera que los sitios de reconocimiento abarcan el primer y/o el segundo identificador y la primera y segunda secciones espedficas de diana de la sonda. La posterior secuenciacion de alto rendimiento de los amplicones o sonda ligada restringida proporcionara la secuencia del identificador y/o (parte de) la secuencia de la seccion o secciones diana y por lo tanto de la presencia de la secuencia diana en la muestra. En esta realizacion, la presencia de la secuencia de reconocimiento para la endonucleasa de restriccion permite que los concatemeros se reduzcan a fragmentos secuenciables.
Sondas “Keylock”
[0041] En ciertas realizaciones, para cada secuencia diana determinada a detectar, se disena preferiblemente al menos un par de dos sondas de manera que cada sonda en el par es capaz de hibridarse a una parte de la secuencia diana y las sondas respectivas en el par comprender cada una ademas una seccion que es complementaria a una seccion correspondiente de la otra sonda en el par de tal manera que ambas sondas son capaces de hibridarse entre sf. Las dos sondas en el par estan disenadas de tal manera que cuando se hibridan entre sf tambien son capaces cada una de hibridarse con una secuencia diana. Cuando se hibridan entre sf, las dos sondas mimetizan o actuan como sondas de candado cuando se utilizan en un ensayo de ligacion de oligonucleotidos para la deteccion de una secuencia de nucleotidos diana, mientras que en las posteriores etapas de amplificacion y deteccion las sondas actuan como un producto de ligacion lineal. Este tipo de sonda ha sido llamada "Keylock” y se da a conocer, entre otras, en WO2004111271. En esta realizacion, la presencia de la secuencia de reconocimiento para la endonucleasa de restriccion, situada entre las secciones de agarre y las secciones espedficas de diana, permite la liberacion de los keylocks de al menos sus secciones de agarre.
Sonda de compuesto
[0042] En ciertas realizaciones de la presente invencion, se utiliza un conjunto de sondas que se describen en WO2005021794. La secuencia diana se pone en contacto con una primera y una segunda sonda, en el que la primera sonda contiene una primera seccion espedfica de diana que es complementaria a la secuencia diana y en la que la primera sonda preferiblemente no contiene una primera secuencia de union a cebador en una primera seccion etiqueta opcional. La segunda sonda contiene una segunda seccion espedfica de diana y una segunda seccion etiqueta en la que la segunda seccion etiqueta contiene una segunda secuencia de union a cebador. La segunda seccion etiqueta puede contener un identificador entre la segunda secuencia de union a cebador y la segunda seccion espedfica de diana. Despues, o simultaneamente con, la hibridacion y la ligacion de las dos sondas, se proporciona una sonda de compuesto que contiene una seccion que es capaz de hibridarse con (parte de) la primera seccion espedfica de diana de la primera sonda y contiene ademas una seccion que contiene una seccion de union a cebador. Tanto la primera seccion etiqueta como la seccion de sonda de compuesto que contiene un sitio de union a cebador pueden contener adicionalmente un sitio de restriccion. El sitio de restriccion en la primera seccion etiqueta se encuentra entre el sitio de union a cebador y la seccion espedfica de diana. El sitio de restriccion en la sonda de compuesto se encuentra entre el sitio de union a cebador y la seccion que puede hibridarse a la primera seccion diana. La sonda de compuesto se hibrida con la primera y segunda sonda ligadas. El alargamiento de la sonda de compuesto a lo largo de la primera y segunda sonda ligadas proporciona la sonda de compuesto alargada que posteriormente puede amplificarse utilizando el primer y segundo cebadores que pueden unirse al primer y segundo sitio de union a cebador. Los amplicones resultantes se pueden restringir usando una o mas endonucleasas de restriccion y se detectan usando las tecnologfas de secuenciacion de alto rendimiento tal como se describe en el presente documento y la secuencia diana en la muestra se puede identificar por medio de la presencia o ausencia del identificador o identificadores y/o la informacion de locus/alelo.
Seccion etiqueta
5
10
15
20
25
30
35
40
45
50
55
60
65
[0043] El termino seccion etiqueta se utiliza para indicar las partes de las sondas que no son capaces de hibridarse a las secuencias de nucleotidos diana. Las secciones etiqueta por lo general contienen identificadores y sitios de union a cebador y en algunas ocasiones, tal como se describe en el presente documento en otra parte, secciones de agarre.
Secuencia de union a cebador
[0044] Las secuencias de union a cebador se pueden incorporar en las sondas para facilitar la amplificacion, ya sea lineal o exponencial. Los sitios de union a cebador se encuentran preferiblemente en otras partes de la sonda que en la seccion espedfica de diana, preferiblemente en la seccion etiqueta que es esencialmente no complementaria a la secuencia diana. Los sitios de union a cebador son capaces de unir cebadores para iniciar la elongacion o amplificacion del cebador. Preferiblemente dentro de un grupo de pares de sondas (por ejemplo, tal como se utiliza dentro de una muestra), los sitios de union a cebador son universales, es decir, solo un grupo predeterminado de sitios de union a cebador se incorporan en la sonda para permitir la elongacion o amplificacion de cebadores multiplex a partir de un numero limitado de cebadores, tales como cebadores que comprenden una o mas bases selectivas en su extremo 3', tal como se conocen de AFLP (EP 0 534 858). Entre los grupos de pares de sondas, los sitios de union a cebador pueden ser diferentes (es decir, tienen una secuencia diferente). En ciertas realizaciones, la Tm de los cebadores capaces de unirse a los diferentes sitios de union a cebador puede ser diferentes entre grupos de pares de sondas. Habitualmente, una secuencia de union a cebador puede tener una longitud de entre 6 y 200 nucleotidos, con una preferencia en el area entre 8 y 50, mas preferiblemente entre 10 y 25 nucleotidos.
Hibridacion
[0045] Tal como se ha mencionado anteriormente en el presente documento, las sondas se ponen en contacto mediante hibridacion con la secuencia diana en la muestra. Los pares de sondas de oligonucleotidos se les permite posteriormente hibridarse con las partes complementarias, preferiblemente adyacentes, de la secuencia diana en la muestra. Los procedimientos y condiciones para la hibridacion espedfica de las sondas de oligonucleotidos a secuencias diana complementarias son bien conocidos en la tecnica (vease por ejemplo, en Sambrook y Russel (2001) "Molecular Cloning: A Laboratory Manual (tercera edicion), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press). Habitualmente, despues de la mezcla de las sondas de oligonucleotidos y secuencias diana, los acidos nucleicos se desnaturalizan mediante incubacion (generalmente a entre 94 grados Celsius y 96 grados Celsius) durante un corto penodo de tiempo (por ejemplo, de 30 segundos a 5 minutos) en un tampon salino. La muestra que contiene las sondas desnaturalizadas y las secuencias diana se deja a continuacion enfriar hasta una temperatura de hibridacion optima para la hibridacion espedfica de las sondas y las secuencias diana, que por lo general es de aproximadamente 5 grados Celsius por debajo de la temperatura de fusion del Idbrido entre la seccion complementaria (seccion diana) de la sonda y su secuencia complementaria (en la secuencia diana). Con el fin de evitar una hibridacion no espedfica o ineficaz de una de las dos sondas de un par, o en una muestra con multiples secuencias diana, se prefiere que, dentro de una muestra, las secciones de las sondas que son complementarias a las secuencias diana tengan una temperatura de fusion similar, preferiblemente identica, entre las diferentes secuencias diana presentes en la muestra. De este modo, las secciones complementarias de la primera y segunda sondas difieren preferiblemente en menos de 20, 15, 10, 5, o 2 grados Celsius en la temperatura de fusion. Esto se facilita mediante el uso de secciones complementarias de la primera y segunda sondas con una longitud similar y/o un contenido de G/C similar, las secciones complementarias difieren preferiblemente en menos de 20, 15, 10, 5, o 2 nucleotidos de longitud y su contenido de G/C difieren en menos de 30, 20, 15, 10, o 5%. Complementario tal como se utiliza en el presente documento significa que una primera secuencia de nucleotidos es capaz de hibridarse espedficamente a una segunda secuencia de nucleotidos en condiciones normales de rigurosidad. Una secuencia de nucleotidos que se considera complementaria a otra secuencia de nucleotidos puede contener una cantidad menor, es decir, preferiblemente menos de 20, 15, 10, 5 o 2%, de los desajuste en el emparejamiento. Alternativamente, puede ser necesario compensar los desajustes en el emparejamiento, por ejemplo, mediante la incorporacion de los llamados nucleotidos universales, tales como, por ejemplo, los descritos en el documento EP-A 974672 o mediante la incorporacion de ciertos nucleotidos modificados que son capaces de compensar los desajustes en el emparejamiento, por ejemplo, mediante el aumento de la temperatura de fusion o el aumento de la especificidad, tal como LNA. Dado que la hibridacion de las sondas a secuencias diana depende de la concentracion, la hibridacion se realiza preferiblemente en un pequeno volumen, es decir, menos de 25 microlitros, preferiblemente menos de 10 microlitros. Bajo estas condiciones de hibridacion, la hibridacion de sondas a secuencias diana habitualmente es rapida y no necesita proceder durante mas de 5, 10 o 15 minutos, aunque se pueden utilizar tiempos de hibridacion mas largos siempre que se mantenga la temperatura de hibridacion para evitar una hibridacion no espedfica. Los tiempos de hibridacion mas largos son mas importantes/necesarios para aplicaciones cuantitativas que se basan en la ocupacion completa de la diana por las sondas de ligacion con el fin de permitir la monitorizacion de cantidades relativas de secuencias diana entre las muestras.
[0046] En ciertas realizaciones de la invencion, se han obtenido excelentes resultados mediante tiempos de hibridacion prolongados, tales como hibridacion durante una noche o mediante hibridacion repetida, tal como 10 ciclos de 1 hora. Los tiempos de hibridacion prolongados pueden ser ventajosos en estos ensayos ya que se reduce la diferencia en la senal debido a diferentes eficiencias de hibridacion y se considera deseable conseguir una
5
10
15
20
25
30
35
40
45
50
55
60
65
hibridacion y la ligacion completas de todas las sondas para las que una secuencia diana esta presente. Se han obtenido excelentes resultados mediante una etapa combinada de ligacion-hibridacion usando una ligasa termoestable descrita en este documento. En esta realizacion, la hibridacion-ligacion se realizo permitiendo que las sondas se hibriden durante 1 hora en presencia de una ligasa termoestable, seguida por una etapa de desnaturalizacion. La repeticion de estas etapas durante al menos 2 veces proporciono buenos resultados. La repeticion de estas etapas 10 veces proporciono excelentes resultados. Para evitar la evaporacion durante la desnaturalizacion y la hibridacion, las paredes y tapas de las camaras de reaccion (es decir, tubos o pocillos de microtitulacion) tambien se pueden calentar hasta al menos la misma temperatura que la mezcla de reaccion que se logra habitualmente mediante el uso de un equipo de amplificacion de ADN comercial o mediante la disposicion de una capa de aceite mineral. En sondas de oligonucleotidos preferidas, la longitud de la seccion complementaria de diana es preferiblemente de al menos 15, 18 o 20 nucleotidos y preferiblemente no mas de 30, 40, o 50 nucleotidos y las sondas tienen preferiblemente una temperatura de fusion desde la seccion diana de al menos 50 grados Celsius, 55 grados Celsius o 60 grados Celsius.
Ligacion
[0047] Los extremos 5'-fosforilado y 3'-hidroxilado respectivo de un par de primera y segunda sondas de oligonucleotidos o de la sonda circularizable de las cuales las secciones espedficas de diana se hibridan esencialmente adyacentes entre sf a las partes complementarias en una secuencia diana se conectan para formar un enlace covalente mediante cualquier medio adecuado conocido en la tecnica. Los extremos de las sondas pueden conectarse enzimaticamente en un enlace fosfodiester por una ligasa, preferiblemente una ADN ligasa. Las ADN ligasas son enzimas capaces de catalizar la formacion de un enlace fosfodiester entre (los extremos de) dos cadenas polinucleotfdicas unidas a sitios adyacentes en una cadena complementaria. Las ADN ligasas habitualmente requieren ATP (EC 6.5.1.1) o NAD (EC 6.5.1.2) como cofactor para sellar las mellas en el ADN de doble cadena. La ADN ligasa adecuada para usar en la presente invencion son ADN ligasa de T4, ADN ligasa de E. coli o preferiblemente una ligasa termoestable como, por ejemplo ligasa de Thermus aquaticus (Taq), ADN ligasa de Thermus thermophilics, o ADN ligasa de Pyrococcus. Alternativamente, la ligacion qmmica de extremos de polinucleotidos modificados adecuadamente se puede utilizar para ligar dos sondas de oligonucleotidos hibridados en sitios adyacentes en las partes complementarias de una secuencia diana. Los ejemplos de grupos reactivos en los extremos de polinucleotidos modificados incluyen, pero no se limitan a, grupos de fosforotioato y tosilato o yoduro, esteres e hidrazida, RC (O)S, RCH2S y [alfa]-haloacilo, tiofosforilo y bromoacetamida y S-pivaloiloximetil-4- tiotimidina. Los agentes de ligacion qmmica incluyen, sin limitacion, agentes activantes, de condensacion, y reductores, tales como carbodiimida, bromuro de cianogeno (BrCN), N-cianoimidazol, imidazol, 1- metilimidazol/carbodiimida/cistamina, ditiotreitol (DTT) y luz ultravioleta. La autoligacion, es decir, la ligacion espontanea en ausencia de un agente de ligacion, tambien esta dentro del alcance de la invencion. Los protocolos detallados para los procedimientos de ligacion qmmica y las descripciones de grupos reactivos apropiados se pueden encontrar, entre otros lugares, en Xu et al., Nucleic Acid Res., 27: 875-81 (1999); Gryaznov y Letsinger, Nucleic Acid Res. 21: 1403-1408 (1993); Gryaznov et al., Nucleic Acid Res. 22: 2366-69 (1994); Kanaya y Yanagawa, Biochemistry 25: 7423-30 (1986); Luebke y Dervan, Nucleic Acids Res. 20: 3005-09 (1992); Sievers y von Kiedrowski, Nature 369: 221-24 (1994); Liu y Taylor, Nucleic Acids Res. 26: 3300-04 (1999); Wang y Kool, Nucleic Acids Res. 22: 2326-33 (1994); Purmal et al., Nucleic Acids Res. 20: 3713-19 (1992); Ashley y Kushlan, Biochemistry 30: 2927-33 (1991); Chu y Orgel, Nucleic Acids Res. 16: 3671-91 (1988); Sokolova et al., FeBS Letters 232: 153-55 (1988); Naylor y Gilham, Biochemistry 5: 2722-28 (1966); y la patente de Estados Unidos No. 5.476.930. La ligacion tanto qmmica como enzimatica tiene lugar de manera mucho mas eficiente en complejos de secuencia diana-sonda perfectamente emparejados en comparacion con complejos en los que una o ambas de las sondas forman un desajuste en el emparejamiento con la secuencia diana en, o cerca del sitio de la ligacion (Wu y Wallace, 1989, Gene 76: 245-254; Xu y Kool, supra). Con el fin de aumentar la especificidad de ligacion, es decir, las eficiencias relativas de ligacion de oligonucleotidos perfectamente emparejados en comparacion con oligonucleotidos no emparejados, la ligacion se realiza preferiblemente a temperaturas elevadas. De este modo, en ciertas realizaciones de la invencion, se emplea una ADN ligasa que permanece activa a 50 - 65 grados Celsius durante tiempos prolongados, pero que se inactiva facilmente a mayores temperaturas, por ejemplo, utilizada en la etapa de desnaturalizacion durante una PCR, habitualmente 90 - 100 grados Celsius. Una de estas ADN ligasa es una ADN ligasa que requiere NAD de una bacteria Gram-positiva (cepa MRCH 065) tal como se conoce del documento WO01/61033. Esta ligasa se conoce como "ligasa 65" y esta disponible comercialmente en MRC Holanda, Amsterdam. En ciertas realizaciones, se usa una Taq ligasa. En ciertas realizaciones, la ligasa se inactiva despues de la ligacion de la primera y segunda sondas. En ciertas realizaciones, la sonda ligada se desnaturaliza de la secuencia diana.
[0048] En ciertas realizaciones de la presente invencion, la hibridacion y la ligacion se llevan a cabo en una etapa combinada. Dicha etapa combinada de hibridacion y ligacion se puede realizar usando un perfil de temperatura dclico y una ligasa termoestable.
Ligacion de espacios
[0049] En una realizacion alternativa, por ejemplo dirigida a la identificacion de indels, los extremos respectivos de las secciones complementaris dianas de las primera y segunda sondas pueden hibridarse de tal manera que se deja
5
10
15
20
25
30
35
40
45
50
55
60
65
un espacio. En ciertas realizaciones, las primera y segunda partes de la secuencia de nucleotidos diana no se encuentran adyacentes. En otras palabras, la primera y segunda secciones espedficas de diana de la primera y segunda sondas no se hibridan a las primera y segunda partes de la secuencia de nucleotidos diana que se encuentran adyacentes. Esto es fundamentalmente diferente de otras variedades de esta tecnologfa, tales como las descritas, entre otras, en los documento EP185494, US5521065, US5692223 y WO 03054311. Este espacio se puede rellenar con un (tercer) (oligo) nucleotido adecuado y ligarse. Dichos procedimientos son conocidos en la tecnica como "ligacion de espacios” (ensayos lllumina Golden Gate) y se describen, entre otros, en los documentos WO 00/77260; US5185243; EP439182; EP320308; W090/01069. Otra posibilidad para rellenar este espacio es mediante la extension de un extremo de la sonda usando una polimerasa y una ligasa en combinacion con nucleotidos individuales o multiples, opcionalmente preseleccionados entre A, T, C, o G, o di-, tri- u otros oligonucleotidos pequenos. En caso de que la secuencia diana sea ARN, sin embargo, otra posibilidad para rellenar el espacio es mediante la extension de un extremo de la sonda usando la transcriptasa inversa y una ligasa en combinacion con nucleotidos individuales o multiples, opcionalmente preseleccionados entre A, T, C o G, o di-, tri- o u otros oligonucleotidos pequenos. La ligacion de espacios puede encontrar aplicacion en la deteccion de SNP individuales/indels o SNP multiples (haplotipado) que se encuentran muy cerca. En esta realizacion, la etapa de secuenciacion comprendena preferentemente la determinacion de la secuencia del espacio.
Amplificacion
[0050] En el procedimiento de la invencion, las sondas ligadas pueden amplificarse para producir una muestra amplificada que comprende sondas ligadas amplificadas (amplicones) que son representaciones de la secuencia de nucleotidos diana mediante cualquier procedimiento de amplificacion de acidos nucleicos adecuado conocido en la tecnica. Los procedimientos de amplificacion de acidos nucleicos emplean generalmente uno o dos cebadores, dNTP, y una (ADN) polimerasa. Un procedimiento preferido para la amplificacion es la PCR. "PCR" o "Reaccion en cadena de la polimerasa", tal como se utiliza aqrn como ejemplo de un procedimiento de amplificacion, es un procedimiento rapido para la amplificacion enzimatica in vitro de un segmento espedfico de ADN. El ADN a amplificar se desnaturaliza calentando la muestra. En presencia de ADN polimerasa y desoxinucleotido trifosfatos en exceso, los oligonucleotidos que se hibridan espedficamente con la secuencia diana preparan una nueva smtesis de ADN. Se prefiere que la polimerasa sea una ADN polimerasa que no expresa actividad de desplazamiento de cadena o al menos no significativamente. Ejemplos de las mismas son Amplitaq y Amplitaq Gold (proveedor Perkin Elmer) y AccuPrime (Invitrogen). Una ronda de smtesis da lugar a nuevas cadenas de longitud determinada, que, como las cadenas parentales, pueden hibridarse con los cebadores sobre tras la desnaturalizacion e hibridacion. El segundo ciclo de desnaturalizacion, hibridacion y smtesis produce dos productos de cadena sencilla que juntos componen un producto de doble cadena discreto, exactamente la longitud entre los extremos del cebador. Este producto discreto se acumula exponencialmente con cada ronda sucesiva de amplificacion. En el transcurso de alrededor de 20 a 30 ciclos, se puede conseguir una amplificacion de muchos millones de veces del fragmento discreto. Los protocolos de PCR son bien conocidos en la tecnica, y se describen en libros de texto estandar de laboratorio, por ejemplo, Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1995). Las condiciones adecuadas para la aplicacion de PCR en el procedimiento de la invencion se describen en el documento EP-A 0 534 858 y Vos et al. (1995; Nucleic Acids Res.23: 4407-4414), donde multiples fragmentos de ADN entre 70 y 700 nucleotidos y que contienen secuencias de union a cebador identicas se amplifican con una eficacia casi igual usando un par de cebadores. En ciertas realizaciones, la polimerasa se inactiva despues de la amplificacion. Otros procedimientos de amplificacion multiplex y/o isotermicos que se pueden aplicar incluyen, por ejemplo amplificacion por drculo rodante (RCA), reaccion en cadena con ligasa (LCR), replicacion de secuencia auto-sostenida (3SR), amplificacion de ARN mediada por Q-B-replicasa, o amplificacion por desplazamiento de cadena (SDA). En algunos casos, esto puede requerir un diseno diferente de las sondas y cebadores sin apartarse de la esencia de la invencion.
[0051] Dentro de la presente invencion, la amplificacion puede realizarse en varios puntos en el tiempo. La amplificacion puede llevarse a cabo para la preparacion de una biblioteca (aumento en el material de partida para la secuenciacion), por ejemplo, despues de la etapa de ligacion y/o como parte de la etapa de secuenciacion (es decir, PCR en emulsion (Roche, Ion Torrent) o amplificacion por puente (lllumina).
Amplicon
[0052] El termino "amplicon", tal como se utiliza aqrn, se refiere al producto de la etapa de amplificacion de las sondas ligadas. El termino "amplificacion", tal como se utiliza aqrn, por tanto, se refiere a una sonda ligada amplificada. Despues de la etapa de ligacion en la que las dos secciones espedficas de diana estan conectadas por medio de una ligasa, la sonda conectada o ligada se combina con uno o mas cebadores y una polimerasa y se amplifica para producir amplicones. La sonda ligada, los cebadores, la polimerasa y/u otros parametros y variables son tales que la amplificacion da lugar a representaciones amplificadas (lineales) de la sonda ligada. Preferiblemente un amplicon es una representacion monomerica de la sonda conectada amplificada. En ciertas realizaciones, el amplicon comprende y, preferiblemente, consiste en nucleotidos del primer y segundo cebador opcional y el identificador o identificadores que estan situados en el medio. En ciertas realizaciones, el amplicon puede contener nucleotidos de la seccion espedfica de diana. Las diversas realizaciones de la presente invencion proporcionaran mas detalles a este respecto (Figura 2).
5
10
15
20
25
30
35
40
45
50
55
60
65
Endonucleasas de restriccion
[0053] Enzima de restriccion: una endonucleasa de restriccion o enzima de restriccion es una enzima que reconoce una secuencia de nucleotidos espedfica (sitio diana) en una molecula de ADN de doble cadena, y escindira las dos cadenas de la molecula de ADN en o cerca de cada sitio diana, dejando un extremo romo o un extremo escalonado (es decir, que contiene un saliente de uno o mas nucleotidos). Tambien existen endonucleasas de restriccion que cortan ss-ADN (EndoTT, Exo I, Exo T) y son de uso en la presente invencion cuando las sondas ligadas no se amplifican sino que directamente de cortan antes de la secuenciacion.
[0054] Una endonucleasa de restriccion Tipo-IIS es una endonucleasa que tiene una secuencia de reconocimiento que esta distante del sitio de restriccion. En otras palabras, las endonucleasas de restriccion de tipo lls escinden fuera de la secuencia de reconocimiento a un lado. Ejemplos de las mismas son NmeAlII (GCCGAG (21/19) y FokI, Alwl, Mme I. Existen enzimas Tipo lIs que cortan fuera de la secuencia de reconocimiento en ambos lados.
[0055] Los cortadores frecuentes y cortadores raros son indicaciones para enzimas de restriccion que tipicamente tienen secuencias de reconocimiento que vanan en numero de nucleotidos desde 4 (tal como MseI) a 6 (EcoRI) e incluso 8 (NotI). Las enzimas de restriccion utilizadas pueden ser cortadores frecuentes y raros. El termino “frecuente” a este respecto se suele utilizar en relacion con el termino “raro”. Las endonucleasas de corte frecuente (tambien conocidas como cortadores frecuentes) son endonucleasas de restriccion que tienen una secuencia de reconocimiento relativamente corta. Los cortadores frecuentes suelen tener 4 o 5 nucleotidos que reconocen y posteriormente cortan. Por lo tanto, un cortador frecuente corta en promedio una secuencia de ADN cada 256-1024 nucleotidos. Los cortadores raros son endonucleasas de restriccion que tienen una secuencia de reconocimiento relativamente larga. Los cortadores raros suelen tener 6 o mas nucleotidos que reconocen y posteriormente cortan. Por lo tanto, un cortador raro de 6 corta en promedio una secuencia de aDn cada 4096 nucleotidos, dando lugar a fragmentos mas largos. Se observa de nuevo que la definicion de frecuente y raro es una con respecto a la otra, lo que significa que cuando una enzima de restriccion de 4 pb, tal como MseI, se utiliza en combinacion con un cortador de 5, tal como Avall, se observa Avall como el cortador raro y MseI como el cortador frecuente.
[0056] Isoesquizomeros; los isoesquizomeros son pares de enzimas de restriccion espedficas para la misma secuencia de reconocimiento y cortan en la misma ubicacion. Por ejemplo, Sph I (GCATGaC) y Bbu I (GCATGAC) son isoesquizomeros el uno del otro. La primera enzima para reconocer y cortar una secuencia determinada se conoce como el prototipo, todas las enzimas posteriores que reconocen y cortan esa secuencia son isoesquizomeros. Una enzima que reconoce la misma secuencia pero corta de otra manera es un neoesquizomero. Los isoesquizomeros son un tipo espedfico (subconjunto) de neoesquizomeros. Por ejemplo, Sma I (CCCAGGG) y Xma I (CacCgGG) son neoesquizomeros (no isoesquizomeros) uno del otro.
[0057] Fragmento de restriccion es el termino usado para las moleculas de ADN producidas mediante la digestion de ADN con una endonucleasa de restriccion. Cualquier genoma determinado (o acido nucleico, independientemente de su origen) sera digerido por una endonucleasa de restriccion particular en un conjunto discreto de fragmentos de restriccion. Los fragmentos de ADN que resultan de la escision con endonucleasa de restriccion se pueden utilizar adicionalmente en una variedad de tecnicas, tales como la secuenciacion. Los fragmentos de restriccion pueden terne extremos romos o un saliente. El saliente se puede eliminar usando una tecnica descrita como pulido. El termino "secuencia interna” de un fragmento de restriccion se utiliza normalmente para indicar que el origen de la parte del fragmento de restriccion reside en el genoma de la muestra, es decir, no forma parte de un adaptador. La secuencia interna deriva directamente del genoma de la muestra, su secuencia es, por tanto, parte de la secuencia del genoma bajo investigacion. El termino secuencia interna se utiliza para distinguir sobre adaptadores, restos de secuencia de reconocimiento de enzimas de restriccion etc.
Secuencia Identificadora
[0058] En ciertas realizaciones, la sonda de oligonucleotidos de la presente invencion comprende, ademas, un identificador o una secuencia identificadora. La secuencia identificadora es una secuencia de oligonucleotidos de una secuencia variable. La longitud del identificador vana de 1 a 30, preferiblemente de 2 a 20, mas preferiblemente de 3 a 10 y lo mas preferido de 4 a 6 nucleotidos. El identificador es una secuencia unica. Unica tal como se utiliza aqrn significa que un identificador o (combinacion de) identificadores identifica de manera inequvoca una secuencia diana espedfica en una muestra o una pluralidad de muestras como diferentes de cualquier otra secuencia diana, alelo, locus en la muestra o pluralidad de muestras. El caracter unico se puede explicar como una secuencia codificada con un CP del tipo descrito por lannone et al. (2000), Cytometry 39: pp. 131-140. Con un identificador de 6 nucleotidos, se pueden realizar un maximo de 4096 combinaciones unicas (= 4 exp 6). En ciertas realizaciones, el identificador contiene una secuencia de anclaje de 2 bases GC (u otra corta definida rica en G/C) en el extremo 3' para asegurar la misma afinidad de union y eficiencia de amplificacion. Ademas se prefiere que el identificador no contenga dos bases consecutivas identicas y se prefiere, ademas, que todos los identificadores utilizados en un conjunto de identificadores difieran en al menos dos bases con el fin de garantizar un reconocimiento ineqrnvoco de secuencia. Cuando se utilizan multiples muestras se prefiere que cada muestra pueda identificarse utilizando un conjunto espedfico de identificadores. El identificador se encuentra generalmente, de manera que la amplificacion o
5
10
15
20
25
30
35
40
45
50
55
60
65
restriccion de las sondas ligadas utilizando las secuencias de union a cebador y/o endonucleasas de restriccion incorporaran el identificador a fin de que el amplicon resultante o sonda ligada restringida contenga la secuencia de identificador.
[0059] Normalmente, esto significa que en la sonda ligada, el identificador esta situado cerca de la seccion diana y entre el primer sitio de union a cebador y la posicion del segundo sitio de union a cebador opcional (vease la figura 1B). En realizaciones que utilizan dos o mas identificadores, por ejemplo, combinaciones locus-alelo, los identificadores tambien se encuentran entre los sitios de union a cebador. En ciertas realizaciones, se pueden proporcionar dos identificadores, uno en cada sonda. Una de las sondas puede verse como una sonda de locus, es decir, dirigida a un locus espedfico y contiene un identificador espedfico de locus. La otra sonda puede ser una sonda espedfica de alelo, es decir, contiene un nucleotido espedfico de alelo, preferiblemente en su punto de ligacion. La sonda espedfica de alelo puede contener un identificador espedfico de alelo. De esta manera, la presencia o ausencia de una combinacion espedfica de locus-alelo se identifica por la presencia/ausencia de los identificadores combinados. Cuando se prueba para toda la variacion alelica de un polimorfismo, solo se necesita una sonda de locus, en combinacion con 4 sondas espedficas de alelo. En ciertas realizaciones, solo la sonda espedfica de alelo puede comprender un identificador que comprende una seccion de identificador espedfica de locus y una seccion de identificador espedfica de alelo, por ejemplo en forma de un identificador de locus de 5 pb, seguido de un identificador de alelo de 2 pb. O un identificador de muestra de 5 pb seguido de un identificador de alelo de 2 pb (en una sonda o en ambas sondas), o y parte de la seccion diana para identificar el locus.
[0060] Tambien son posibles identificadores basados en la muestra, solos, o en combinacion con identificadores de locus y/o alelo. Los identificadores de muestra pueden proporcionarse de antemano en la sonda, pero tambien se pueden ligar a las sondas o amplicones restringidos. Los identificadores basados en la muestra tambien pueden estar presentes en los adaptadores que se ligan a las sondas o amplicones restringidos.
[0061] En base a esta grna estan ahora disponibles para el experto en la materia una variedad de posibilidades. Por lo tanto, cuando se analizan multiples muestras en un proceso de secuenciacion, uno de los identificadores puede usarse para la identificacion de la muestra en la pluralidad de muestras. Para fines de identificacion, tambien es posible utilizar una combinacion de la secuencia de la seccion espedfica de diana (que identifica el locus y/o alelo), un (o parte de un) identificador que identifica el alelo y/o locus y otro (parte del) identificador que identifica la muestra.
[0062] En ciertas realizaciones, los identificadores se pueden utilizar para la identificacion de la muestra y el alelo, y el locus se puede identificar por al menos parte de la secuencia de la seccion espedfica de diana.
[0063] En resumen, se pueden introducir identificadores (ID), de forma independiente, en la seccion etiqueta de la sonda, en un adaptador ligado a las sondas ligadas restringidas o amplicones, introducidos a traves de un cebador durante una etapa de amplificacion y/o en las propias secciones espedficas de diana (informacion de locus (L)/alelo (Al)). Los identificadores se pueden situar, de forma independiente, en la informacion de locus/alelo, entre el sitio de restriccion (RE) y la secuencia de alelo/locus (secciones espedficas de diana), entre el adaptador que esta ligado a las sondas ligadas restringidas o amplicones restringidos. Tanto la introduccion como la posicion se pueden disponer de forma independiente en una o ambas sondas.
[0064] En la figura 3B se proporciona una representacion esquematica de algunas de las diversas posiciones individuales de los identificadores en las sondas (ligadas).
[0065] En una realizacion particular preferida de la invencion, las sondas comprenden una seccion diana y una secuencia de reconocimiento y, opcionalmente, una secuencia de union a cebador. Despues de la ligacion, las sondas ligadas son restringidas o amplificadas, seguido de restriccion/digestion para producir sondas ligadas restringidas (RLP) o amplicones restringidos (RA). A los RLP/RA resultantes, se ligan uno o dos adaptadores que contienen uno o mas identificadores. Los RLP/RA ligados a adaptador resultantes son secuenciados. La combinacion alelo/locus de la secuencia diana se identifica por la informacion de secuencia de la seccion diana. La muestra se identifica basandose en el identificador o identificadores en el adaptador o adaptadores ligados. Esta es una manera eficiente de analisis de multiples secuencias diana en una muestra, que combina los resultados de una pluralidad de muestras y se analizan las muestras combinadas. Se ilustra en la figura 1C.
Cebadores
[0066] La sonda ligada se amplifica usando un par de cebadores correspondientes a los sitios de union a cebador. En ciertas realizaciones, el par de cebadores contiene un solo cebador y la amplificacion es lineal en lugar de exponencial. En ciertas realizaciones, el par comprende un primer cebador que es capaz de hibridarse a la primera seccion de union a cebador y es capaz de iniciar la amplificacion o elongacion. En ciertas realizaciones, el par comprende, ademas, un segundo cebador que es capaz de hibridarse a la segunda seccion de union a cebador y es capaz de iniciar la amplificacion o elongacion. En ciertas realizaciones, el segundo cebador tiene la misma secuencia que el segundo sitio de union a cebador en la sonda, es decir, es un cebador inverso. En una realizacion preferida, al menos uno de los cebadores o el mismo par de cebadores se usa para la amplificacion de dos o mas
5
10
15
20
25
30
35
40
45
50
55
60
65
sondas ligadas diferentes en una muestra, preferiblemente para la amplificacion de todas las sondas ligadas en una muestra. Dicho cebador se conoce a veces como cebador universal ya que estos cebadores son capaces de cebar la amplificacion de todas las sondas conectadas que contienen el sitio de union a cebador universal correspondiente y por consiguiente de todas las sondas ligadas que contienen el sitio de union a cebador universal. Los diferentes cebadores que se utilizan en la amplificacion en la etapa (i) son preferiblemente esencialmente iguales en la eficiencia de hibridacion y cebado. Por lo tanto, los cebadores en una muestra difieren preferiblemente menos de 20, 15, 10, 5, o 2 grados Celsius en la temperatura de fusion. Esto se puede lograr tal como se describe en el presente documento en otra parte para las secciones espedficas de diana de las sondas de oligonucleotidos. A diferencia de la secuencia de las secciones espedficas de diana, la secuencia de los cebadores no esta dictada por la secuencia diana. Por lo tanto, las secuencias de cebadores se pueden disenar de manera convenientemente mediante el ensamblaje de la secuencia de tetrameros de nucleotidos, en los que cada tetramero contiene una A, T, C y G o por otros modos que aseguren que el contenido de G/C y la temperatura de fusion de los cebadores son identicos o muy similares. La longitud de los cebadores (y los sitios de union a cebador correspondientes en la seccion etiqueta de la segunda sonda) es preferiblemente de al menos 12, 15 o 17 nucleotidos y preferiblemente no mas de 25, 30, 40 nucleotidos. En una cierta realizacion, al menos dos de las segundas sondas de oligonucleotidos que son complementarias a al menos dos secuencias diana diferentes en una muestra comprenden cada una una seccion etiqueta que comprende una seccion de union a cebador que es complementaria a una unica secuencia de cebador.
[0067] En ciertas realizaciones, para garantizar una eficiencia de cebado similar en comparacion con otros cebadores que albergan la misma secuencia de anclaje, el cebador puede comprender una secuencia de anclaje 3', preferiblemente una secuencia de anclaje de 2 pb, preferiblemente una secuencia de anclaje GC. Habitualmente, la secuencia de union a cebador correspondiente tambien albergara el complemento de la misma.
[0068] Por lo tanto, preferiblemente al menos uno de los primer y segundo cebadores en un par de cebadores se usa para la amplificacion de sondas ligadas correspondientes a al menos dos secuencias diana diferentes en una muestra, mas preferiblemente para la amplificacion de sondas conectadas correspondientes a todas las secuencias diana en una muestra. Preferiblemente solo se utiliza un primer cebador unico y en algunas realizaciones solamente se utiliza un unico primer y un unico segundo cebador para la amplificacion de todas las sondas (ligadas) conectadas. La utilizacion de cebadores comunes para la amplificacion de multiples fragmentos diferentes normalmente es ventajoso para la eficacia de la etapa de amplificacion. Las sondas ligadas obtenidas a partir de la ligacion de las secciones de sonda hibridadas se amplifican, utilizando un par de cebadores, que consiste preferiblemente en un par de cebadores para cada una de las sondas ligadas en la muestra. El par de cebadores comprende cebadores que son complementarios a secuencias de union a cebador que estan presentes en la sonda ligada. Un par de cebadores habitualmente comprende un primer y al menos un segundo cebador, pero puede consistir en solamente un unico cebador que ceba en ambas direcciones. Se han obtenido excelentes resultados usando cebadores que son conocidos en la tecnica como cebadores AFLP, tal como se describe, entre otros, en EP534858 y en Vos et al., Nucleic Acid Research, 1995, vol. 23, 4407-4414 y se discute en mas detalle en este documento a continuacion.
Secuenciacion de alto rendimiento
[0069] La secuenciacion o cribado de alto rendimiento, a menudo abreviada como HTS, es un procedimiento para la experimentacion cientffica especialmente relevante para los campos de la biologfa y la qrnmica. A veces se refiere tambien como Next Generation Sequencing y se describe ampliamente en Janitz Ed. Next Generation Genome sequencing, Wiley VCH, 2008. A traves de una combinacion de la robotica moderna y otros equipos de laboratorio especializados, se permite a un investigador el cribado de manera efectiva de grandes cantidades de muestras de forma simultanea.
[0070] Se prefiere que la secuenciacion se realice utilizando procedimientos de secuenciacion de alto rendimiento, tales como los procedimientos descritos en los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, Wo 2004/070007 y WO 2005/003375 (todos a nombre de de 454 Life Sciences, ahora Roche Diagnostics), por Seo et al. (2004) Proc. Natl. Acad. Sci. USA 101: 5488-93, y tecnologfas de Helicos, Solexa, US Genomics, etcetera.
[0071] Secuenciacion de alto rendimiento basada en tecnologias de Roche GS FLX
[0072] En ciertas realizaciones, se prefiere que la secuenciacion se lleve a cabo utilizando el aparato y/o procedimiento dado a conocer en los documentos WO 03/004690, WO 03/054142, WO 2004/069849, Wo 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Life Sciences, ahora Roche Diagnostics). La tecnologfa descrita permite la secuenciacion de 40 millones de bases en un solo proceso y es 100 veces mas rapido y mas barato que tecnologfa competidora. La tecnologfa de secuenciacion consiste aproximadamente de 5 etapas:
1) fragmentacion de ADN y ligacion de adaptadores espedficos para crear una biblioteca de ADN de cadena sencilla (ADNss);
2) hibridacion de ADNss a microesferas, emulsificacion de las microesferas en microrreactores de agua en aceite y realizacion de la PCR en emulsion para amplificar las moleculas de ADNss individuales sobre microesferas;
5
10
15
20
25
30
35
40
45
50
55
60
65
3) seleccion de enriquecimiento para las microesferas que contienen moleculas de ADNss amplificadas en su superficie;
4) deposicion de microesferas que transportan ADN en una placa PicoTiter (TM); y
5) secuenciacion simultanea en mas de 1.000.000 de pocillos mediante la generacion de una senal luminosa de pirofosfato. El procedimiento se explicara en mas detalle a continuacion.
[0073] En una realizacion preferida, la secuenciacion comprende las etapas de:
(a) hibridacion de fragmentos adaptados a microesferas, estando cada microesfera hibridada con un solo fragmento adaptado;
(b) emulsionar las microesferas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en aceite una unica microesfera;
(c) cargar las microesferas en pocillos, comprendiendo cada pocillo una unica microesfera; y generar una senal de pirofosfato. En la primera etapa (a), los adaptadores de secuenciacion se ligan a fragmentos dentro de la biblioteca de combinacion. Dicho adaptador de secuenciacion puede incluir un identificador adicional y mas secuencias para hibridarse a una microesfera, una region de cebadores de secuenciacion y una region de cebadores de PCR. De este modo, se obtienen fragmentos adaptados. En una primera etapa, los fragmentos adaptados se hibridan a microesferas, hibridandose cada microesfera con un unico fragmento adaptado. Al conjunto de fragmentos adaptados, se anaden microesferas en exceso para garantizar la hibridacion de un unico fragmento adaptado por microesfera para la mayona de las microesferas (distribucion de Poisson). En una siguiente etapa, las microesferas se emulsionan en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en aceite una sola microesfera. Los reactivos de PCR estan presentes en los microrreactores de agua en aceite lo que permite que se lleve a cabo una reaccion de PCR dentro de los microrreactores. Posteriormente, los microrreactores se rompen, y las microesferas que comprenden ADN (microesferas positivas en ADN) se enriquecen. En una siguiente etapa, las microesferas se cargan en pocillos, comprendiendo cada pocillo una unica microesfera. Los pocillos son preferiblemente parte de una placa PicoTiter (TM) que permite la secuenciacion simultanea de una gran cantidad de fragmentos. Despues de la adicion de microesferas dque transportan enzimas, se determina la secuencia de los fragmentos usando pirosecuenciacion. En etapas sucesivas, la placa PicoTiter (TM) y las microesferas, asf como las microesferas cone enzimas en las mismas, se someten a diferentes desoxirribonucleotidos en presencia de reactivos de secuenciacion convencionales, y tras la incorporacion de un desoxirribonucleotido se genera una senal de luz que se registra. La incorporacion del nucleotido correcto generara una senal de pirosecuenciacion que se puede detectar.
[0074] La pirosecuenciacion en sf es conocida en la tecnica y se describe, entre otros, en
www.biotagebio.com,
www.pyrosequencing.com/section technology. La tecnologfa se aplica adicionalmente, por ejemplo, en los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Life Sciences, ahora Roche Diagnostics). En la presente invencion, las microesferas estan equipadas preferiblemente con secuencias para cebador (de union) y/o secciones de agarre o partes de las mismas que son capaces de unirse a los amplicones o las sondas ligadas, segun sea el caso. En otras realizaciones, las sondas o los cebadores usados en la amplificacion en emulsion estan equipadas con secuencias que permiten la union de los amplicones o las sondas ligadas a las microesferas con el fin de permitir la posterior amplificacion en emulsion seguido por secuenciacion. Los amplicones o sondas ligadas secuenciadas revelaran la identidad del identificador o identificadores y, opcionalmente parte de la secuencia diana y, de este modo, de la presencia o ausencia de la secuencia diana en la muestra.
Secuenciacion de alto rendimiento basada en tecnologias lllumina Genoma Analyzer/HiSeq/Miseq
[0075] Uno de los procedimientos para la secuenciacion de alto rendimiento se describe, entre otros, en WO0006770, WO0027521, WO0058507, WO0123610, WO0157248, W00157249, WO02061127, WO03016565, WO03048387, WO2004018497, WO2004018493, WO2004050915, WO2004076692, WO2005021786,
WO2005047301, WO2005065814, WO2005068656, WO2005068089, WO2005078130. En esencia, el procedimiento comienza con fragmentos ligados a adaptadores de ADN. El ADN a utilizar en la tecnologfa de secuenciacion descrita en la presente es sondas ligadas restringidas (RLP) o amplicones restringidos (RA). El ADN ligado a adaptador se hibrida al azar a un campo denso de cebadores que se unen a una superficie solida, habitualmente en una celda de flujo. Despues de la elongacion, el extremo de los fragmentos recien formados se hibrida a un cebador que esta unido al soporte solido en las proximidades del fragmento. Este cebador se extiende en presencia de nucleotidos y polimerasas para proporcionar fragmentos ds. Los cebadores se extienden en presencia de nucleotidos y polimerasas en la denominada amplificacion por puente en fase solida para proporcionar fragmentos de cadena doble. La desnaturalizacion y la repeticion de la amplificacion por puente en fase solida dan lugar a densos grupos de fragmentos amplificados distribuidos sobre la superficie. La secuenciacion se inicia mediante la adicion de cuatro nucleotidos terminadores reversibles marcados de manera diferente, cebadores y polimerasa a la celda de flujo. Despues de la primera ronda de la extension del cebador, se detectan los marcadores, se registra la identidad de las primeras bases incorporadas y se eliminan el extremo 3' bloqueado y el fluoroforo de la base incorporada. A continuacion, se determina la identidad de la segunda base de la misma manera y, de este modo, continua la secuenciacion. En la presente invencion, las sondas ligadas o los amplicones se unen a la superficie a traves de la secuencia de union a cebador, la secuencia del cebador o en algunas realizaciones, la seccion de agarre o una combinacion de las mismas. La secuencia se determina tal como se ha indicado, incluyendo
5
10
15
20
25
30
35
40
45
50
55
60
65
la secuencia identificadora y la secuencia diana asociada y se identifica su presencia o ausencia. Secuenciacion de alto rendimiento basada en tecnoloaias de Ion Torrent
[0076] Uno de los procedimientos para la secuenciacion de alto rendimiento se describe, entre otros, en
US2010137143, WO2010008480, US2010282617, WO2009158006, WO2010016937, WO2010047804,
US2010197507, US2010304982, WO2010138182, WO2010138186, WO2010138187, WO2010138188. El
procedimiento se basa en la fragmentacion de ADN de muestra, la ligacion de adaptadores, generacion de cadenas de ADNss, captura de las cadenas en microesferas seguido por PCR en emulsion y la posterior hibridacion de un oligonucleotido para cebar la smtesis de ADN. En esencia, se basa en una matriz para la medicion del proton liberado que se produce cuando dos dNTPs estan acoplados el uno al otro. Cada vez que se agrega un nucleotido, se libera un proton. La medicion de la liberacion del proton es una medida de la incorporacion exitosa de los nucleotidos en el oligonucleotido.
[0077] La deteccion de un nucleotido espedfico en una cadena de ADN en crecimiento se produce en el interior de un pocillo fabricado de un chip semiconductor espedfico. El chip secuenciacion captura mediciones de voltaje de la liberacion directa de iones hidrogeno despues de la polimerizacion del ADN. El numero total de mediciones independientes, o lecturas de secuencia, es funcion del numero de sensores y los pocillos fabricados que un chip contiene.
Adaptadores
[0078] En algunas de las realizaciones de la presente invencion, uno o mas adaptadores se ligan a uno o ambos extremos de los amplicones restringidas o sondas ligadas restringidas.
[0079] Los adaptadores, tal como se usan aqrn, son moleculas cortas de ADN de doble cadena con un numero limitado de pares de bases, por ejemplo, de aproximadamente 10 a aproximadamente 50 pares de bases de longitud, que estan disenados de tal manera que se pueden ligar a los extremos de fragmented de restriccion. Los adaptadores se componen generalmente de dos oligonucleotidos sinteticos que tienen secuencias de nucleotidos que son parcialmente complementarias entre sf. Cuando se mezclan los dos oligonucleotidos sinteticos en solucion bajo las condiciones apropiadas, se hibridaran entre sf formando una estructura de doble cadena. Despues de la hibridacion, un extremo de la molecula adaptadora esta disenado de tal manera que es compatible con el extremo de un fragmento de restriccion y se puede ligar al mismo; el otro extremo del adaptador se puede disenar de modo que no se puede ligar, pero esta necesidad no es el caso (adaptadores dobles ligados).
[0080] Preferiblemente, los adaptadores se ligan antes de la etapa de secuenciacion. A las sondas ligadas restringidas o a los amplicones restringidos se ligan adaptadores que se pueden utilizar en una etapa de amplificacion posterior que forma parte de la etapa de secuenciacion (PCR en emulsion o amplificacion por puente), por ejemplo para hibridarse a un portador (tal como una microesfera) utilizado en la tecnologfa de secuenciacion y para proporcionar funcionalidades adicionales que pueden ser utiles durante la etapa de secuenciacion, tales como sitios de union a cebador para facilitar una etapa de amplificacion como parte del protocolo de secuenciacion. Dichos adaptadores se refieren generalmente como "adaptadores de secuenciacion” y su diseno y funcionalidad se ejemplificaran aqrn a continuacion. Ejemplos de dichos adaptadores de secuenciacion son conocidos en la tecnica como adaptadores P5 y P7 y se utilizan en la tecnologfa lllumina. Otras tecnologfas emplean adaptadores conceptualmente similares.
[0081] De este modo, en ciertas realizaciones, un adaptador (doble cadena) se liga al extremo del fragmento de restriccion proporcionado por la endonucleasa de restriccion. El adaptador esta construido de tal manera que es ligable al extremo del fragmento de restriccion. Si el extremo del fragmento de restriccion es romo, ya sea por el pulido o por la endonucleasa, el adaptador tambien tiene preferiblemente extremos romos. El adaptador puede construirse o disenarse de tal manera que solo una cadena es ligable al extremo del fragmento de restriccion, mientras que la otra cadena del adaptador puede disenarse de manera que no se liga, por ejemplo a traves del uso de un nucleotido no fosforilado. Si el extremo del fragmento de restriccion esta escalonado, se prefiere utilizar un adaptador escalonado que contenga preferiblemente al menos un extremo ligable. Un extremo ligable en este contexto es un extremo que es al menos complementario a los restos del sitio de restriccion de la endonucleasa de restriccion. Si se utiliza una enzima de restriccion en las sondas ligadas o en las sondas ligadas amplificadas, se puede utilizar un adaptador. Tambien es posible utilizar multiples adaptadores cuando se utiliza una enzima de restriccion en las sondas ligadas o en las sondas ligadas amplificadas. El uso de multiples adaptadores puede proporcionar una funcionalidad adicional, por ejemplo en la separacion (seleccion) de parte de las sondas ligadas o en las sondas ligadas amplificadas como parte de una reduccion de la complejidad. En ciertas realizaciones, cuando se usan dos (una primero y una segunda) endonucleasas de restriccion, dos (un primer y un segundo) adaptadores se pueden ligar a los respectivos extremos de los fragmented de restriccion.
[0082] En ciertas realizaciones, el adaptador puede ser un adaptador en forma de Y (a veces llamado un "adaptador de horquilla”). Un adaptador en forma de Y puede tener un extremo escalonado o un extremo romo. En general, un adaptador en forma de Y se produce a partir de dos fragmented de ADN de cadena sencilla. Los dos fragmented de
5
10
15
20
25
30
35
40
45
50
55
60
65
ADN de cadena sencilla contienen cada uno una seccion en un extremo de la cadena que es complementaria a la otra, de tal manera que las secciones son capaces de hibridar las dos cadenas entre sr Los fragmentos de ADN de cadena sencilla contienen cada uno una seccion adicional que no es complementaria a la otra y que no se hibrida. El extremo complementary permite al adaptador en forma de Y ligarse a los extremos de los amplicones restringidos o sondas ligadas restringidas. El extremo complementario puede ser de cualquier longitud adecuada y puede ser de 150 nucleotidos de longitud. El uso de un adaptador en forma de Y permite la introduccion de dos cadenas diferentes de ADN usando solo un tipo de adaptador. Una representacion esquematica del mismo se proporciona en la figura 5A.
[0083] Los adaptadores pueden contener, ademas, identificadores y el adaptador en forma de Y puede contener identificadores diferentes en los dos brazos del adaptador en forma de Y.
[0084] En cierta realizacion, el adaptador en forma de Y puede disenarse de tal manera que un adaptador en forma de Y es capaz de ligarse a ambas cadenas de un fragmento de restriccion, mientras que al mismo tiempo se evita la autoligacion del adaptador en forma de Y. En esta realizacion, el saliente del fragmento de restriccion esta parcialmente relleno antes de la etapa de ligacion, permitiendo asf que el adaptador en forma de Y se ligue solo al fragmento y no a otros adaptadores en forma de Y. Una representacion esquematica del mismo se proporciona en la figura 5B.
[0085] Como alternativa, los adaptadores tambien pueden ser del tipo conocido como "adaptadores de horquilla” que son capaces de hibridarse y ligarse a ADN de cadena sencilla, proporcionando ADN parcialmente de doble cadena.
[0086] En otra realizacion relacionada con el uso de sondas ligadas de cadena sencilla en la etapa en la que las sondas ligadas son restringidas antes de la etapa de secuenciacion, se contempla el uso de nucleasas de corte de cadena sencilla. Como alternativa, se puede proporcionar un oligonucleotido que proporcionara una cadena ds local que posteriormente se puede cortar usando la endonucleasa de restriccion. Los adaptadores tambien pueden ser del tipo conocido como "adaptadores de horquilla” que son capaces de hibridarse y ligarse al ADN de cadena sencilla, proporcionando ADN parcialmente de doble cadena que, posteriormente, se puede cortar con una endonucleasa. Una representacion esquematica de las dos ultimas variantes se proporciona en la figura 5C.
[0087] Las tecnologfas de secuenciacion descritas actualmente contienen algunas variaciones en sus protocolos de secuenciacion. El uso de estas variaciones de secuenciacion puede tener influencia en el diseno de las diferentes sondas y cebadores usados en la presente invencion, la forma en que se obtienen los datos de secuencia y la calidad, fiabilidad y la cantidad de datos generados.
Secuenciacion de lectura unica unidireccional
[0088] Con una secuenciacion de lectura unica, la sonda ligada restringida o el amplicon restringido se ligan a uno o dos adaptadores (adaptadores de secuenciacion) y se secuencian en una direccion utilizando un cebador. La secuencia de nucleotidos que se somete finalmente a secuenciacion se indica comunmente en esta descripcion como el "fragmento de secuenciacion '.
[0089] Esta realizacion se representa esquematicamente en la Figura 4A. En esta realizacion, el fragmento ligado al adaptador de secuenciacion se secuencia empezando a partir del cebador (cebador de secuenciacion, SEQ PR) en el fragmento, secuenciando de ese modo al menos parte de la seccion etiqueta que quedaba despues de la restriccion, al menos parte de la secuencia diana (es decir, secciones espedficas de diana). Cualquier identificador situado 3' del cebador de secuenciacion se secuenciara a lo largo como lo hara (parte de) la secuencia diana. Este identificador puede estar presente en el adaptador de secuenciacion y/o en la seccion etiqueta que quedaba despues de la restriccion. La secuencia diana puede identificarse a continuacion por el identificador o identificadores o la secuencia diana o una combinacion de los mismos.
Secuenciacion de doble etiquetado de lectura unica unidireccional
[0090] Con doble etiquetado de lectura unica unidireccional, (doble cebado de lectura unica unidireccional) el amplicon restringido o sonda ligada restringida se ligan a uno o dos adaptadores de secuenciacion y se secuencian en una direccion, pero con dos cebadores (SEQ PR1, SEQ PR2). Esta realizacion se representa esquematicamente en la Figura 4B. En esta realizacion, identica a la secuenciacion de lectura unica, el fragmento de secuenciacion se secuencia empezando a partir del cebador de secuenciacion SEQ PR1 en el fragmento, secuenciando de ese modo al menos parte de la seccion etiqueta que permaneda despues de la restriccion, al menos parte de la secuencia diana (es decir, secciones espedficas de diana). En esta realizacion, la lectura de secuencia resultante de esta etapa se indica como "lectura larga". El segundo cebador (SEQ PR2) se dirige a una segunda parte de la sonda ligada restringida o el amplicon restringido ligados a un adaptador o adaptadores de secuenciacion y amplifica una segunda parte de los mismos, habitualmente indicado como "lectura corta”.
[0091] Cuando se realiza el reagrupamiento de los fragmentos de secuenciacion para la secuenciacion, el segundo cebador de secuenciacion tambien puede dar lugar a una lectura larga (vease la figura 4C). En el reagrupamiento,
5
10
15
20
25
30
35
40
45
50
55
60
65
los fragmentos de secuenciacion se someten a un protocolo en el que se hibridan al portador utilizando el otro adaptador de secuenciacion (que da lugar a un puente del fragmento de secuenciacion en el portador y la posterior deshibridacion del primer adaptador de secuenciacion para el portador en el que se hibridaron y unieron). El resultado es que la orientacion del fragmento frente al portador se desplaza (reagrupado) y la secuenciacion se puede realizar de nuevo. Un ejemplo de dicho reagrupamiento y la secuenciacion desde ambos lados (secuenciacion de extremos emparejados) se describe en Bentley et. Nature 2008, 456, 53-59. Habiendo realizado un reagrupamiento se puede, por tanto, llegar a dos lecturas largas (Long 1, Long 2).
Secuenciacion de doble etiquetado bidireccional
[0092] Con la secuenciacion de doble etiquetado bidireccional (secuenciacion de doble de cebado bidireccional), representado en la Figura 4D, el fragmento de secuenciacion se secuencia usando secuenciacion de extremos emparejados en el que el fragmento se secuencia desde ambos lados.
[0093] En esta realizacion, un tercer identificador puede estar presente en el fragmento de secuenciacion que puede ser dirigido mediante el uso de un cebador que tiene una orientacion inversa que puede resultar en una segunda lectura larga (Long 2). El tercer identificador se puede dirigir (secuenciar) mediante el segundo cebador o un tercer cebador que se dirige espedficamente para identificar el tercer identificador (ejemplificado en la figura por una superposicion diferente, pero este no tiene por que ser el caso). En una realizacion adicional, el cebador con la orientacion inversa no se utiliza para identificar el identificador, de manera que el tercer identificador puede omitirse y la etapa de secuenciacion en la direccion inversa sirve para proporcionar datos de la secuencia del fragmento de secuenciacion.
Secuenciacion de extremos emparejados
[0094] Tal como se utiliza aqrn, “secuenciacion de extremos emparejados” en un procedimiento que se basa en secuenciacion de alto rendimiento, en particular basado en las plataformas que actualmente son comercializadas por lllumina y Roche. Illumina ha dado a conocer un modulo de hardware (el modulo PE) que se puede instalar en el secuenciador existente como una actualizacion, que permite la secuenciacion de ambos extremos de la plantilla, generando de ese modo lecturas de extremos emparejados. En particular, es preferente utilizar la secuenciacion de extremos emparejados, en particular, utilizando la tecnologfa de Roche o lllumina, en los procedimientos de acuerdo con la presente invencion. Ejemplos de secuenciacion de extremos emparejados se describen por ejemplo en US20060292611 y en publicaciones de Roche (secuenciacion 4540).
Secuenciacion de pares acoplados (“mate pair”)
[0095] La secuenciacion de pares acoplados (“mate pair”) es una variante de la secuenciacion de extremos emparejados en el que los extremos se acoplan. Los fragmentos de ADN a secuenciar, tales como productos de ligacion tratados con endonucleasa de restriccion (o amplicones a partir de los mismos) se circularizan, se fragmentan y los fragmentos que contienen los extremos del ADN original se secuencian posteriormente obteniendo de este modo informacion de secuencia a partir de ambos extremos del ADN original en una etapa de secuenciacion. La secuenciacion de pares acoplados se puede aplicar a cualquiera de los fragmentos de secuenciacion que se describen en este documento. Vease tambien
www.illumina.com para ejemplos de secuenciacion de pares acoplados.
[0096] La i nformacion detallada sobre el concepto de secuenciacion de pares acoplados se proporciona en la figura
6. A modo de ejemplo se usa uno de los productos de ligacion, pero el principio de secuenciacion de pares acoplados se aplica a cualquiera de los fragmentos de secuenciacion de la presente invencion, independientemente de los elementos presentes en los fragmentos de secuenciacion. Para ilustrar esto, se generaliza un fragmento de secuenciacion en una lmea solida que representa un fragmento de secuenciacion de ADN. El fragmento se circulariza y se fragmenta (a traves de cizalla (corte) o restriccion). A los extremos del fragmento, se ligan adaptadores de secuenciacion y la cadena de ADN resultante se somete a secuenciacion, preferiblemente desde ambos extremos (emparejados).
[0097] A lo largo de esta memoria, figuras y reivindicaciones adjuntas las nociones "primera" y "segunda" se utilizan para distinguir entre elementos, tales como las sondas, adaptadores, cebadores, etc. utilizados en el ensayo y sus respectivos componentes. Las nociones "primeros" y "segunda" no se utilizan en el presente documento como sumas, es decir, no es para que solo pueda haber un segundo componente cuando tambien hay un primer componente. Por razones de coherencia y facilidad de referencia estas nociones tambien se utilizan cuando la propia realizacion no esta constituida de dos sondas o dos componentes. Por ejemplo, una sonda circularizable, siendo solo una sonda, todavfa contiene una primera y segunda seccion espedfica de diana. Asimismo, en la figura 1, por ejemplo, ya sea una de la primera y segunda sonda puede contener un identificador. En el caso de la primera sonda este se representa como el primer identificador y en el caso de la segunda sonda esto se representa como el segundo identificador. En caso de que la segunda sonda contiene un identificador y la primera sonda no, este identificador puede contemplarse en esta solicitud como el segundo identificador sin implicar la existencia de un primer identificador.
5
10
15
20
25
30
35
40
Ejemplo de deteccion de polimorfismo de un solo nucleotido (SNP) en Melon
1. Aislamiento de ADN
[0098] Se aislo el ADN genomico dos descendientes F2 de una poblacion segregante de melon Charantais de material de hojas usando un procedimiento CTAB modificado descrito por Stuart y Via (Stuart, C.N., Jr y Via, L.E. (1993) A rapid CTAB DNA isolation technique useful for RAPD fingerprinting and other PCR applications. Biotechniques. Vol. 14, 748-750). Las muestras de ADN se diluyeron hasta una concentracion de 100 ng/|il en TE (Tris-HCl 10 mM pH 8,0, EDTA 1 mM) y se almacenaron a -20°C.
2. Amplificacion de ADN
[0099] Con el fin de tener suficiente ADN disponible para multiples pruebas, el ADN aislado se amplifico utilizando el kit de amplificacion de ADN lllustra GenomiPhi v2 (GE Healthcare) de acuerdo con las especificaciones del fabricante.
3. Seleccion de los SNP de melon
[0100] Los SNP de melon se seleccionaron de una coleccion que previamente se habfa incorporado en ensayos BeadXpress (lllumina) y se utilizaron para determinar el genotipo de varias de las muestras antes mencionadas. Se seleccionaron un total de 23 SNP que conteman una amplia variedad de SNP, vease la tabla 1. Los SNP sirven como ejemplos y no limitan el concepto general de la tecnoiogfa de la invencion.
TABLA 1: SNP seleccionados de melon
SNP
SNP
Alelos SNP SNP Alelos
1
SBG0004r A/G 13 SBG0023 T/C
2
SBG0005 T/C 14 SBG0025 A/G
3
SBG0008 A/G 15 SBG0026 T/C
4
SBG0009 C/G 16 SBG0027 T/C
5
SBG0010 C/T 17 SBG0028 T/C
6
SBG0013 A/C 18 SBG0030 A/T
7
SBG0014 A/C 19 SBG0033 T/C
8
SBG0015 A/T 20 SBG0036 T/C
9
SBG0016 T/G 21 SBG0037 T/C
10
SBG0018 T/C 22 SBG0039 A/G
11
SBG0021 C/G 23 SBG0040 A/T
12
SBG0022 A/G
4. Diseno de sondas de oligonucleotidos para la reaccion de ligacion de oligonucleotidos
[0101] Se disenaron sondas de oligonucleotidos (orientacion 5'-3') utilizando procedimientos comunes basados en la secuencia conocida de los loci y se seleccionaron para discriminar los alelos de SNP para cada uno de los 23 loci descritos en la Tabla 1. Se incluyeron las regiones de union a cebador de PCR. Todas las sondas fueron fosforiladas en el extremo 5'. Para cada SNP, se disenaron dos sondas de alelo que conteman el alelo espedfico y una sonda inversa. La fosforilacion de las sondas inversa es funcional, mientras que la fosforilacion de las sondas espedficas de alelo es meramente un resultado de la reduccion de costes.
[0102] Todos los oligonucleotidos fueron adquiridos de Metabion, Martinsried, Alemania. La concentracion de los oligonucleotidos se ajusto a 1 |iM.
[0103] Se preparo una mezcla de 4x sonda combinando 1 |il de cada sonda de alelo (= 46x) y 2 |il de cada sonda inversa (= 23x). La mezcla de 4x sonda se diluyo 4 veces con agua MilliQ para obtener una mezcla de 1x sonda.
5. Diseno de los cebadores de amplificacion de PCR
5
10
15
20
25
30
35
40
45
50
55
60
65
[0104] Las secuencias de los cebadores utilizados para la amplificacion por PCR de los productos de ligacion de oligonucleotidos eran complementarios a la regiones de union a cebador de PCR incorporadas en las sondas de ligacion descritas en "4. Diseno de sondas de oligonucleotidos para la reaccion de ligacion de oligonucleotidos”. Las secuencias de los cebadores de PCR se derivan de las secuencias de adaptadores utilizadas en el proceso AFLP tal como se describe por Zabeau y Vos, 1993: Selective restriction fragment amplification; a general method for DNA fingerprinting. EP 0534858-A1, B1; patente US 6045994) y Vos et al (Vos, P., Hogers. R., Bleeker. M., Reijans. M., van de Lee. T., Hornes, M., Frijters. A., Pot. J., Peleman J., Kuiper M. et al (1995) AFLP: a new technique for DNA fingerprinting. Nucl Acids Res, 21, 4407-4414). Espedficamente, el extremo 3' de las secuencias de los cebadores se modifico para albergar una parte del sitio de reconocimiento de la enzima de restriccion para EcoRI (sonda espedfica de alelo) o HindIII (sonda inversa (= espedfica de locus)).
6. Tampones y reactivos
[0105] La concentracion de los tampones fue: tampon de ligacion de oligonucleotidos multiplex (10x): Tris-HCl 200 mM pH 7,6, KAc 250 mM, MgAc 100 mM, NAD 10 mM, ditiotreitol 100 mM, Triton-X100 al 1%. Tampon de PCR (10x): Tris-HCl 100 mM pH 8,3, KCl 500 mM, MgCl2 15 mM, gelatina al 0,01% (p/v). Tampon de ligacion de restriccion (5x): 5x tampon de ADNasa (Affymetrix), ditiotreitol 25 mM, BSA 250 |ig/ml. Tampon de elucion Minelute incluyendo Tween: Tris 10 mM pH 8,5, Tween X-100 al 0,1%.
7. Reaccion de ligacion de oligonucleotidos multiplex y amplificacion
[0106] Las reacciones de ligacion se llevaron a cabo por duplicado para cada una de las dos muestras de ADN aislado de la siguiente manera: se combinaron 100 a 200 ng de ADN genomico (amplificado) con 1 |il de tampon de ligacion de oligonucleotidos multiplex, 4 unidades de ADN ligasa Taq (New England Biolabs), 0,4 |il de mezcla de 1x Sonda y agua MilliQ hasta un total de 10 |il. La mezcla de reaccion se incubo durante 2 minutos a 94°C, seguido por 4 horas a 60°C. Las reacciones se mantuvieron a 4°C hasta su uso posterior. Las reacciones de ligacion se diluyeron 4 veces con 1x tampon de ligacion de oligonucleotidos multiplex. La amplificacion de los productos de ligacion se llevo a cabo de la siguiente manera: 10 |il de reaccion de ligacion diluida 4 veces, 30 ng de cada cebador (E00LF y H00LR), 0,2 |il de mezcla 20 mM de cada dNTP, 2 |il de 10x tampon de PCR, 0,4 unidades de AmpliTaq-Gold (Applied Biosystems) y agua MilliQ hasta un total de 20 |il. Las reacciones de amplificacion se realizaron por duplicado. El perfil de termociclado se realizo en un PE9700 (Perkin Elmer Corp.) con un bloque de oro o plata usando las siguientes condiciones: Etapa 1: Incubacion Pre PCR: 12 minutos a 94°C. Etapa 2: Desnaturalizacion: 30 segundos a 94°C; hibridacion; 30 segundos a 65°C en el primer ciclo. En cada ciclo siguiente esta temperatura de hibridacion se redujo en un 0,7°C. Extension: Extension de 1 minuto a 72°C.
[0107] El numero total de ciclos es 13 Etapa 3: desnaturalizacion: 30 segundos a 94°C. Hibridacion; 30 segundos a 56°C. Extension: extension de 1 minuto a 72°C. Numero total de ciclos es de 23.
[0108] Etapa 4: Extension: 7 minutos a las 72°C. Las reacciones se mantuvieron a 4°C hasta su uso posterior. Los productos de amplificacion (20 |il) se purificaron usando el kit MinElute (Qiagen) y se eluyeron en 10 |il de agua MilliQ.
8. Reaccion de ligacion de restriccion
[0109] Los productos de amplificacion de la etapa 7 (7 |il) fueron digeridos con las enzimas de restriccion EcoRI (20 unidades) e HindIII (20 unidades) en un volumen total de 40 |il que contema 1x tampon de ligacion de restriccion e incubacion a 37°C durante 2 horas.
[0110] Se ligaron adaptadores a los productos de digestion a traves de la adicion de 5 pmol de adaptador generico de HindIII, 5 pmol de adaptador de EcoRI que contema ID de muestra, 0,1 |il de ATP 100 mM, 2 |il de 5x tampon de ligacion de restriccion, 1 unidad de ADN ligasa T4 en un volumen total de 10 |il e incubacion a 37°C durante 3 horas.
[0111] La composicion de la secuencia del adaptador de EcoRI que contema un ID de la muestra era tal que la cadena superior contema un ID de muestra situado en 3' (5 nt) y la cadena inferior contema un ID de muestra situado en 5' (5 nt) que estaba en complemento inverso de la correspondiente cadena superior. Los ID de muestra difenan entre la muestra 1 y muestra 2.
[0112] El extremo 3' del adaptador de cadena inferior fue modificado con un grupo amino.
[0113] Los adaptadores se prepararon mezclando cantidades iguales (pmol) de cada oligo (superior e inferior) en un tubo eppendorf. La concentracion final de los adaptadores era de 50 |iM.
[0114] La composicion de la secuencia del adaptador de HindIII se diseno y sintetizo de manera analoga al adaptador de EcoRI, con y sin un identificador.
9. Amplificacion de los productos de ligacion de restriccion
5
10
15
20
25
30
35
40
45
50
55
[0115] Los productos de ligacion de restriccion se diluyeron 10 veces en agua MilliQ. Se mezclaron cinco |il de producto de ligacion de restriccion diluida 10 veces con 5 ng de cebador directo, 30 ng de cebador inverso, 0,2 20 mM de cada dNTP, 2 |il de 10x tampon PCR, 0,08 |il de ADN polimerasa AmpliTaq 5 U/|il (Applied Biosystems) y 12,02 |il de agua MilliQ. La mezcla de reaccion se coloco en un termociclador (PE9700, bloque de oro o plata) y se aplico el siguiente perfil: preincubacion: 2 minutos 72°C, Ciclado 50 veces: 30 segundos 94°C, 2 minutos 58°C, 2 minutos 72°C. De cada reaccion de amplificacion se agruparon 5 |il de los cuales 130 |il se purificaron usando una columna de MinElute (Qiagen). El producto purificado se eluyo en 30 |il de tampon de elucion con la adicion de Tween.
10. Secuenciacion de los productos de amplificacion
[0116] La secuenciacion de los productos amplificados de la etapa 9 se realizo en el Genome Analyzer II (lllumina) que es una plataforma de secuenciacion por smtesis y utiliza la tecnologfa Clonal Single Molecule Array (CSMATM) que utiliza diferentes protocolos de secuenciacion incluyendo secuenciacion de lectura unica, secuenciacion de doble etiquetado de lectura unica unidireccional, secuenciacion de doble etiquetado bidireccional, secuenciacion de extremos emparejados y secuenciacion de pares acoplados.
11. Procesado de datos y determinacion del genotipo
[0117] Las lecturas de secuencia obtenidas se cribaron para la presencia de los identificadores. Permanecieron un total de 1.644.183 lecturas. Todas las etiquetas de ID se detectaron con un numero promedio de lecturas por muestra de 411.046. El numero de lecturas por muestra vario de 308.105 (Muestra 1) a 603.889 (Muestra 3). Se realizo un control de calidad adicional en las lecturas que conteman las etiquetas de ID de la muestra. Esto inclrna la presencia del sitio de reconocimiento de EcoRI, la ausencia de lecturas que conteman homopolfmeros (definido como tramos contiguos del mismo nucleotido sobre mas de 20 posiciones), la ausencia de lecturas con emparejamiento positivo frente a la base de datos del cloroplasto de NCBI, la ausencia de lecturas que contienen 'N' en la secuencia y la ausencia de lecturas con puntuacion baja de calidad (QS promedio <15) en los primeros 50 nucleotidos de la lectura. El numero de lecturas eliminadas por muestra variaba de 12.445 (Muestra 4) a 28.447 (Muestra 1), con un promedio de 18.769. El numero de lecturas eliminadas por muestra representaba un pequeno porcentaje del numero total de lecturas (promedio de 4,6%). Como consecuencia, el porcentaje promedio de lecturas que pasaban los filtros de control de calidad fue alta (95,4%). Las lecturas que pasaban el control de calidad se utilizaron como datos de entrada para determinar los genotipos de las muestras para cada uno de los SNP. Este proceso implico la alineacion de las lecturas a las secuencias de referencia de los loci utilizando el software BWA, el procesamiento de los datos de salida con SAMtools (incluyendo la clasificacion, fusion e indexacion), la determinacion de las apariciones de los alelos en las muestras y la determinacion de los genotipos para cada muestra basada en las relaciones de las apariciones de los alelos. SAMtools esta disponible a traves de
http://samtools.sourceforge.net. Cuando una posicion degenerada en las secuencias de referencia estaba presente, se utilizo una clasificacion alfabetica para la base para reemplazar la posicion ambigua.
[0118] Se detectaron SNP en todas las 23 diana y se determinaron los genotipos utilizando todos los tipos de secuenciacion.
12. Validacion del genotipo
[0119] La comparacion de los genotipos generados a partir de los duplicados (muestras 1 y 2, muestras 3 y 4) y de los diferentes protocolos de secuenciacion mostro que el 100% de los genotipos identificados eran identicos entre los duplicados.
[0120] Los genotipos determinados en la etapa 11 se compararon con los genotipos disponibles que se generaron utilizando la tecnologfa BeadXpress (lllumina). Los resultados de la comparacion mostraron que:
- 21 de los loci de SNP mostraron 100% de correlacion entre la estrategia actual y los datos de BeadXpress.
- 1 locus de SNP (SBG0014) no se puntuo en el conjunto de datos BeadXpress, es decir, puntuaciones U (= desconocido), mientras que en este experimento la estrategia utilizada genero un genotipo claro.
- 1 locus de SNP (SBG0039) mostro consistentemente una discrepancia homocigota (estrategia actual) frente a heterocigotica (BeadXpress).

Claims (13)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Procedimiento para la determinacion de una secuencia de nucleotidos diana en una muestra que comprende las etapas de:
    (a) proporcionar para cada secuencia de nucleotidos diana (T) una primera sonda (P1) y una segunda sonda (P2), en el que la primera sonda comprende una primera seccion espedfica de diana (TS1) y una primera seccion etiqueta (TAG1) que es no complementaria a la secuencia de nucleotidos diana y que comprende opcionalmente una primera secuencia de union a cebador (PBS1), en el que la primera seccion etiqueta comprende una primera secuencia de reconocimiento (RE1) para una primera endonucleasa de restriccion;
    en el que la segunda sonda comprende una segunda seccion espedfica de diana (TS2) y una segunda seccion etiqueta (TAG2) que es no complementaria a la secuencia de nucleotidos diana y que comprende una segunda secuencia de union a cebador (PBS2) opcional, en el que la segunda seccion etiqueta comprende una segunda secuencia de reconocimiento (RE2) para una segunda endonucleasa de restriccion;
    (b) permitir que la primera y segunda seccion espedfica de diana de la respectiva primera y segunda sonda se hibriden con la secuencia diana;
    (c) ligar la primera y segunda sonda cuando las secciones espedficas de diana respectivas de las sondas se hibridan con secciones esencialmente adyacentes en la secuencia diana para proporcionar sondas ligadas (LP);
    (d) opcionalmente amplificar las sondas ligadas con un primer cebador opcional y/o un segundo cebador opcional para proporcionar amplicones (A);
    (e) restringir las sondas ligadas o amplicones con la primera y/o segunda endonucleasa de restriccion para proporcionar sondas ligadas restringidas (RLP) o amplicones restringidos (RA), ligar un primer y/o un segundo adaptador que contiene un identificador de base adaptador (AD ID1, AD ID2) a las sondas ligadas restringidas (RLP) o amplicones restringidos (RA);
    (f) someter las sondas ligadas restringidas (RLP) ligadas a adaptador o amplicones restringidos (RA) ligados a adaptador a tecnologfa de secuenciacion de alto rendimiento para determinar al menos parte de la secuencia de nucleotidos de las sondas ligadas restringidas o amplicones restringidos
    (g) identificar la presencia, ausencia o cantidad de la secuencia de nucleotidos diana en la muestra.
  2. 2. Procedimiento, segun la reivindicacion 1, en el que una primera secuencia de identificador basada en una sonda (ID1) se encuentra en la primera seccion etiqueta y/o en el que una segunda secuencia de identificador basada en una sonda (ID2) se encuentra en la segunda seccion etiqueta.
  3. 3. Procedimiento, segun las reivindicaciones 1-2, en el que el primer identificador basado en una sonda se encuentra entre la primera secuencia de reconocimiento para una endonucleasa de restriccion y la primera seccion espedfica de diana y/o en el que el segundo identificador basado en una sonda se encuentra entre la segunda secuencia de reconocimiento para una endonucleasa de restriccion y la segunda seccion espedfica de diana.
  4. 4. Procedimiento, segun las reivindicaciones 1-3, en el que la hibridacion, ligacion y el relleno de huecos opcional se realizan en una etapa combinada.
  5. 5. Procedimiento, segun las reivindicaciones 1-4, en el que la secuencia de reconocimiento para la endonucleasa de restriccion para la primera seccion etiqueta tiene una secuencia de nucleotidos diferente en comparacion con el sitio de reconocimiento para la endonucleasa de restriccion para la segunda seccion etiqueta.
  6. 6. Procedimiento, segun las reivindicaciones 1-5, en el que la secuenciacion de alto rendimiento comprende secuenciacion mediante smtesis.
  7. 7. Procedimiento, segun las reivindicaciones 1-5, en el que la secuenciacion de alto rendimiento comprende amplificacion por puente o amplificacion en emulsion.
  8. 8. Procedimiento, segun las reivindicaciones 1-5, en el que la secuenciacion de alto rendimiento comprende secuenciacion de lectura unica unidireccional, secuenciacion de doble cebado de lectura unica unidireccional, secuenciacion bidireccional (extremos emparejados) o secuenciacion de pares acoplados (“mate pair”).
  9. 9. Procedimiento, segun las reivindicaciones 1-8, en el que se determina una pluralidad de secuencias diana en una muestra o en el que se determina una secuencia diana en una pluralidad de muestras o en el que se determina una pluralidad de secuencias diana en una pluralidad de muestras.
  10. 10. Procedimiento, segun las reivindicaciones 1-9, en el que las sondas son sondas circularizables, sondas “keylock” y/o sondas de compuesto.
  11. 11. Procedimiento para el genotipado de una muestra biologica para la presencia, ausencia o cantidad de una secuencia diana en la muestra utilizando un ensayo de ligacion de nucleotidos que comprende al menos dos sondas, en el que al menos una de las sondas comprende ademas de una seccion diana una secuencia de reconocimiento para una endonucleasa de restriccion, en el que el procedimiento comprende ademas una etapa de ligacion para proporcionar sondas ligadas, en el que despues de la ligacion las sondas ligadas se restringen o
    amplifican seguido por la restriccion para proporcionar sondas ligadas restringidas (RLP) o amplicones restringidos (RA), en el que a los RLP/RA resultantes se ligan uno o dos adaptadores que contienen uno o mas identificadores, y en el que se secuencian los RLP/RA ligados a adaptador resultantes.
    5 12. Procedimiento, segun la reivindicacion 11, en el que el procedimiento comprende ademas una etapa de
    amplificacion para proporcionar amplicones.
  12. 13. Procedimiento, segun la reivindicacion 12, en el que el procedimiento comprende ademas una etapa en la que los amplicones o sondas ligadas se ponen en contacto con una endonucleasa de restriccion para proporcionar
    10 amplicones restringidos y/o sondas ligadas restringidas.
  13. 14. Procedimiento, segun las reivindicaciones 11-13, en el que el genotipado es genotipado codominante que comprende al menos dos sondas espedficas de alelos.
    15 15. Procedimiento, segun las reivindicaciones 11-14, en el que se determina al menos parte de la secuencia de parte
    de los amplicones restringidos o sondas ligadas restringidas.
ES12738652.2T 2011-07-08 2012-07-09 Genotipado a base de secuencias en base a ensayos de ligación a oligonucleótidos Active ES2556580T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161505787P 2011-07-08 2011-07-08
US201161505787P 2011-07-08
PCT/NL2012/050493 WO2013009175A1 (en) 2011-07-08 2012-07-09 Sequence based genotyping based on oligonucleotide ligation assays

Publications (1)

Publication Number Publication Date
ES2556580T3 true ES2556580T3 (es) 2016-01-19

Family

ID=46579302

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12738652.2T Active ES2556580T3 (es) 2011-07-08 2012-07-09 Genotipado a base de secuencias en base a ensayos de ligación a oligonucleótidos

Country Status (8)

Country Link
US (4) US9777322B2 (es)
EP (2) EP2980226A1 (es)
JP (1) JP6028025B2 (es)
AU (1) AU2012281242B2 (es)
CA (1) CA2840929C (es)
DK (1) DK2729580T3 (es)
ES (1) ES2556580T3 (es)
WO (1) WO2013009175A1 (es)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
WO2013009175A1 (en) * 2011-07-08 2013-01-17 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays
WO2013142389A1 (en) 2012-03-20 2013-09-26 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
WO2013192292A1 (en) * 2012-06-21 2013-12-27 Justin Lamb Massively-parallel multiplex locus-specific nucleic acid sequence analysis
JP6234463B2 (ja) 2012-09-10 2017-11-22 ジーンスカイ ダイアグノスティクス(スーツォウ) インコーポレーテッドGenesky Diagnostics (Suzhou) Inc. 核酸の多重分析の方法
US9270344B2 (en) * 2013-02-01 2016-02-23 Creating Revolutions, LLC Combination process interaction
CA2901138A1 (en) * 2013-03-12 2014-10-09 Counsyl, Inc. Systems and methods for prenatal genetic analysis
EP3968023A1 (en) 2013-08-19 2022-03-16 Singular Bio Inc. Assays for single molecule detection and use thereof
JP6442534B2 (ja) * 2014-06-02 2018-12-19 ベース4 イノベーション リミテッド ヌクレオチド多型の検出方法
AU2015296602B2 (en) * 2014-08-01 2021-09-16 F. Hoffmann-La Roche Ag Detection of target nucleic acids using hybridization
CN104372093B (zh) * 2014-11-10 2016-09-21 博奥生物集团有限公司 一种基于高通量测序的snp检测方法
US11739371B2 (en) * 2015-02-18 2023-08-29 Invitae Corporation Arrays for single molecule detection and use thereof
GB2536446B (en) * 2015-03-17 2020-06-03 Salisbury Nhs Found Trust PCR method
US10844428B2 (en) * 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US10689690B2 (en) 2015-08-13 2020-06-23 Centrillion Technology Holdings Corporation Library construction using Y-adapters and vanishing restriction sites
PT3387152T (pt) 2015-12-08 2022-04-19 Twinstrand Biosciences Inc Adaptadores, métodos e composições melhorados para sequenciamento duplex
WO2018127408A1 (en) * 2017-01-05 2018-07-12 Tervisetehnoloogiate Arenduskeskus As Quantifying dna sequences
AU2018210188B2 (en) 2017-01-18 2023-11-09 Illumina, Inc. Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
US11739367B2 (en) 2017-11-08 2023-08-29 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
EP3768853A4 (en) * 2018-03-23 2021-04-28 Board Of Regents The University Of Texas System EFFICIENT SEQUENCING OF DSDNA WITH EXTREMELY LOW ERROR RATE
AU2019287163A1 (en) 2018-06-12 2020-12-03 Keygene N.V. Nucleic acid amplification method
AU2019300172A1 (en) 2018-07-12 2021-01-28 Twinstrand Biosciences, Inc. Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
WO2020142631A2 (en) * 2019-01-04 2020-07-09 William Marsh Rice University Quantitative amplicon sequencing for multiplexed copy number variation detection and allele ratio quantitation
EP3927840A1 (en) 2019-02-21 2021-12-29 Keygene N.V. Genotyping of polyploids
US20220372559A1 (en) * 2019-09-09 2022-11-24 Sherlock Biosciences, Inc. System
WO2021048291A1 (en) * 2019-09-12 2021-03-18 Glaxosmithkline Intellectual Property Development Limited Method for screening libraries
WO2022182682A1 (en) 2021-02-23 2022-09-01 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
US20230348962A1 (en) * 2021-11-04 2023-11-02 Florida State University Research Foundation, Inc. Using Hairpin Formation To Identify DNA and RNA Sequences Having A Target Nucleic Acid Sequence

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
GB8612087D0 (en) 1986-05-19 1986-06-25 Ici Plc Hybridisation probes
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
DE68926504T2 (de) 1988-07-20 1996-09-12 David Segev Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
KR950013953B1 (ko) 1990-01-26 1995-11-18 애보트 래보라토리즈 리가제 연쇄 반응에 적용가능한 표적 핵산의 증폭 방법
DE69233719T2 (de) 1991-09-24 2009-01-02 Keygene N.V. Primer, Sätze und Restriktionsfragmente und deren Benutzung in selektiver Restriktionsfragmentenamplifikation
US5470705A (en) 1992-04-03 1995-11-28 Applied Biosystems, Inc. Probe composition containing a binding domain and polymer chain and methods of use
EP0695305B1 (en) 1993-04-12 2003-08-06 Northwestern University Method of forming oligonucleotides
US5692223A (en) 1993-10-22 1997-11-25 Minolta Co., Ltd. Remotely-controlled flash photographing system
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5876924A (en) 1994-06-22 1999-03-02 Mount Sinai School Of Medicine Nucleic acid amplification method hybridization signal amplification method (HSAM)
US20070269799A9 (en) 1994-06-22 2007-11-22 Zhang David Y Nucleic acid amplification methods
US5942391A (en) 1994-06-22 1999-08-24 Mount Sinai School Of Medicine Nucleic acid amplification method: ramification-extension amplification method (RAM)
WO1996015271A1 (en) 1994-11-16 1996-05-23 Abbott Laboratories Multiplex ligations-dependent amplification
SE506908C2 (sv) 1995-09-08 1998-03-02 Ulf Landegren Inst F Medicinsk Medicinsk användning av padlockprober
EP2369007B1 (en) 1996-05-29 2015-07-29 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US6312892B1 (en) 1996-07-19 2001-11-06 Cornell Research Foundation, Inc. High fidelity detection of nucleic acid differences by ligase detection reaction
EP0974672B1 (en) 1998-07-21 2003-04-09 Keygene N.V. Improved primers for AFLP amplification
JP2002521064A (ja) 1998-07-30 2002-07-16 ソレックサ リミテッド アレイ生体分子およびシークエンシングにおけるその使用
GB0002310D0 (en) 2000-02-01 2000-03-22 Solexa Ltd Polynucleotide sequencing
AU758630B2 (en) 1998-11-06 2003-03-27 Solexa Ltd. A method for reproducing molecular arrays
AU3567900A (en) 1999-03-30 2000-10-16 Solexa Ltd. Polynucleotide sequencing
US20020086289A1 (en) 1999-06-15 2002-07-04 Don Straus Genomic profiling: a rapid method for testing a complex biological sample for the presence of many types of organisms
US6156178A (en) 1999-07-13 2000-12-05 Molecular Dynamics, Inc. Increased throughput analysis of small compounds using multiple temporally spaced injections
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
GB0002389D0 (en) 2000-02-02 2000-03-22 Solexa Ltd Molecular arrays
US6221603B1 (en) 2000-02-04 2001-04-24 Molecular Dynamics, Inc. Rolling circle amplification assay for nucleic acid analysis
EP1130113A1 (en) 2000-02-15 2001-09-05 Johannes Petrus Schouten Multiplex ligation dependent amplification assay
AU2001265121A1 (en) 2000-05-30 2001-12-11 Applera Corporation Methods for detecting target nucleic acids using coupled ligation and amplification
AU2002231934A1 (en) 2001-01-30 2002-08-12 Solexa Ltd. Arrayed polynucleotides and their use in genome analysis
US20050009022A1 (en) 2001-07-06 2005-01-13 Weiner Michael P. Method for isolation of independent, parallel chemical micro-reactions using a porous filter
GB0119719D0 (en) 2001-08-13 2001-10-03 Solexa Ltd DNA sequence analysis
US6902921B2 (en) 2001-10-30 2005-06-07 454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US20030119004A1 (en) 2001-12-05 2003-06-26 Wenz H. Michael Methods for quantitating nucleic acids using coupled ligation and amplification
EP1319718A1 (en) 2001-12-14 2003-06-18 Keygene N.V. High throughput analysis and detection of multiple target sequences
DE10162904B4 (de) 2001-12-20 2006-05-11 Jeyes Deutschland Gmbh Vorrichtung zur Abgabe eines flüssigen Wirkstoffs in ein Spülwasser
WO2003060163A2 (en) * 2001-12-28 2003-07-24 Keygene N.V. Discrimination and detection of target nucleotide sequences using mass spectrometry
EP3795577A1 (en) 2002-08-23 2021-03-24 Illumina Cambridge Limited Modified nucleotides
EP1560838B1 (en) 2002-08-23 2009-05-13 Illumina Cambridge Limited Labelled nucleotides
US20060094016A1 (en) 2002-12-02 2006-05-04 Niall Gormley Determination of methylation of nucleic acid sequences
DE602004024034D1 (de) 2003-01-29 2009-12-24 454 Corp Nukleinsäureamplifikation auf basis von kügelchenemulsion
GB0304371D0 (en) 2003-02-26 2003-04-02 Solexa Ltd DNA Sequence analysis
WO2005001129A2 (en) * 2003-06-06 2005-01-06 Applera Corporation Mobility cassettes
ES2322904T3 (es) 2003-06-17 2009-07-01 Keygene N.V. Medio y metodo para la deteccion de secuencias nucleotidicas diana usando ensayos de ligamiento con pares de sondas oligonucleotidicas mejoradas.
GB0320059D0 (en) 2003-08-27 2003-10-01 Solexa Ltd A method of sequencing
WO2005026389A2 (en) * 2003-08-29 2005-03-24 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Ligation-based method of analysis of single nucleotide polymorphisms on genomic dna
ES2539784T3 (es) 2003-09-02 2015-07-06 Keygene N.V. Procedimientos basados en OLA para la detección de secuencias de ácidos nucleicos objetivo
EP1602733A1 (en) 2004-06-02 2005-12-07 Keygene N.V. Detection of target nucleotide sequences using an asymmetric oligonucleotide ligation assay
GB0326073D0 (en) 2003-11-07 2003-12-10 Solexa Ltd Improvements in or relating to polynucleotide arrays
EP2789383B1 (en) 2004-01-07 2023-05-03 Illumina Cambridge Limited Molecular arrays
GB0400584D0 (en) 2004-01-12 2004-02-11 Solexa Ltd Nucleic acid chacterisation
GB0400974D0 (en) 2004-01-16 2004-02-18 Solexa Ltd Multiple inexact matching
GB0402895D0 (en) 2004-02-10 2004-03-17 Solexa Ltd Arrayed polynucleotides
US20060211000A1 (en) * 2005-03-21 2006-09-21 Sorge Joseph A Methods, compositions, and kits for detection of microRNA
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
EP3045544A1 (en) * 2005-12-22 2016-07-20 Keygene N.V. Method for high-throughput aflp-based polymorphism detection
WO2007101075A2 (en) * 2006-02-22 2007-09-07 Applera Corporation Double-ligation method for haplotype and large-scale polymorphism detection
US8460866B2 (en) * 2006-03-01 2013-06-11 Keygene N.V. High throughput sequence-based detection of SNPs using ligation assays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
CA2672315A1 (en) 2006-12-14 2008-06-26 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes using large scale fet arrays
WO2009092035A2 (en) 2008-01-17 2009-07-23 Sequenom, Inc. Methods and compositions for the analysis of biological molecules
WO2010008480A2 (en) 2008-06-25 2010-01-21 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes using large scale fet arrays
JP2011525990A (ja) 2008-06-26 2011-09-29 ライフ テクノロジーズ コーポレーション Fetアレイを用いて分子相互作用を検出するための方法および装置
US20100035252A1 (en) 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
CN102301228A (zh) 2008-10-22 2011-12-28 生命技术公司 用于生物和化学分析的集成式传感器阵列
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
EP2425240A4 (en) 2009-04-30 2012-12-12 Good Start Genetics Inc METHOD AND COMPOSITION FOR EVALUATING GENETIC MARKERS
EP3301104B1 (en) 2009-05-29 2019-10-30 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
EP2603607B1 (en) 2010-08-11 2016-04-06 Celula, Inc. Genotyping dna
EP2710145B1 (en) 2011-05-17 2015-12-09 Dxterity Diagnostics Incorporated Methods and compositions for detecting target nucleic acids
WO2013009175A1 (en) * 2011-07-08 2013-01-17 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays

Also Published As

Publication number Publication date
AU2012281242B2 (en) 2016-12-22
US20180023135A1 (en) 2018-01-25
CA2840929C (en) 2020-03-24
US10422001B2 (en) 2019-09-24
JP6028025B2 (ja) 2016-11-16
US20200071757A1 (en) 2020-03-05
CA2840929A1 (en) 2013-01-17
DK2729580T3 (en) 2015-12-14
AU2012281242A1 (en) 2014-02-27
WO2013009175A1 (en) 2013-01-17
US10988807B2 (en) 2021-04-27
EP2729580A1 (en) 2014-05-14
US20140221217A1 (en) 2014-08-07
US20210207213A1 (en) 2021-07-08
EP2980226A1 (en) 2016-02-03
EP2729580B1 (en) 2015-09-16
JP2014520525A (ja) 2014-08-25
US9777322B2 (en) 2017-10-03
US11873529B2 (en) 2024-01-16

Similar Documents

Publication Publication Date Title
ES2556580T3 (es) Genotipado a base de secuencias en base a ensayos de ligación a oligonucleótidos
ES2446927T3 (es) Detección rápida de SNP basada en secuencias utilizando ensayos de ligación
US10538806B2 (en) High throughput screening of populations carrying naturally occurring mutations
JP2024060054A (ja) ヌクレアーゼ、リガーゼ、ポリメラーゼ、及び配列決定反応の組み合わせを用いた、核酸配列、発現、コピー、またはdnaのメチル化変化の識別及び計数方法
US20230392191A1 (en) Selective degradation of wild-type dna and enrichment of mutant alleles using nuclease
KR102643955B1 (ko) 근접 보존 전위
ES2829295T3 (es) Detección de alto rendimiento de marcadores moleculares basados en AFLP y secuenciación de alto rendimiento
US7579155B2 (en) Method for identifying the sequence of one or more variant nucleotides in a nucleic acid molecule
KR20160117419A (ko) Dna의 에러-프리 염기서열 분석
US7749708B2 (en) Method for identifying the sequence of one or more variant nucleotides in a nucleic acid molecule
ES2292270B1 (es) Procedimiento para detectar selectivamente acidos nucleicos con estructuras atipicas convertibles en muescas.