ES2559313T3 - Secuenciación de ácidos nucleicos de alto rendimiento por expansión - Google Patents

Secuenciación de ácidos nucleicos de alto rendimiento por expansión Download PDF

Info

Publication number
ES2559313T3
ES2559313T3 ES08771483.8T ES08771483T ES2559313T3 ES 2559313 T3 ES2559313 T3 ES 2559313T3 ES 08771483 T ES08771483 T ES 08771483T ES 2559313 T3 ES2559313 T3 ES 2559313T3
Authority
ES
Spain
Prior art keywords
anchor
subunit
residue
probe
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08771483.8T
Other languages
English (en)
Inventor
Mark Stamatios. KOKORIS
Robert N. Mcruer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Roche Diagnostics Seattle Inc
Original Assignee
Stratos Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stratos Genomics Inc filed Critical Stratos Genomics Inc
Application granted granted Critical
Publication of ES2559313T3 publication Critical patent/ES2559313T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método para la secuenciación de un ácido nucleico diana, que comprende: a) proporcionar una hebra hija producida por una síntesis dirigida por molde, comprendiendo la hebra hija una pluralidad de subunidades acopladas en una secuencia correspondiente a una secuencia de nucleótidos contigua de toda o una porción del ácido nucleico diana, en la que las subunidades individuales comprenden un anclaje, al menos una sonda o residuo de nucleobase, y al menos un enlace selectivamente escindible; b) escindir el al menos un enlace selectivamente escindible para dar un Xpandómero de una longitud mayor que la pluralidad de las subunidades de la hebra hija, comprendiendo el Xpandómero los anclajes y elementos indicadores para analizar la información genética en una secuencia correspondiente a la secuencia de nucleótidos contigua de toda o una porción del ácido nucleico diana; y c) detectar los elementos indicadores del Xpandómero.

Description

5
10
15
20
25
30
35
40
45
50
55
DESCRIPCION
Secuenciacion de acidos nucleicos de alto rendimiento por expansion
Antecedentes
Campo tecnico
La presente invencion esta generalmente relacionada con la secuenciacion de acidos nucleicos, asf como con metodos relacionados con la misma.
Descripcion de la tecnica relacionada
Las secuencias de acidos nucleicos codifican la informacion necesaria para que los seres vivos funcionen y se reproduzcan, y son esencialmente un diseno de vida. La determinacion de tales secuencias es, por tanto, una herramienta util en la investigacion pura en como y donde viven los organismos, as^ como en las ciencias aplicadas tales como el desarrollo de farmacos. En medicina, las herramientas de secuenciacion pueden usarse para diagnosticar y desarrollar tratamientos para diversas patologfas, que incluyen cancer, enfermedad cardfaca, trastornos autoinmunitarios, esclerosis multiple u obesidad. En la industria, la secuenciacion puede usarse para disenar procesos enzimaticos u organismos sinteticos mejorados. En biologfa, tales herramientas pueden usarse para estudiar la salud de ecosistemas, por ejemplo, y asf tener una amplia gama de utilidad.
Una secuencia de ADN unica del individuo proporciona informacion valiosa referente a su susceptibilidad a ciertas enfermedades. La secuencia proporcionara a los pacientes la oportunidad de cribar para la deteccion temprana y para recibir tratamiento preventivo. Ademas, dado el proyecto individual de un paciente, los profesionales clmicos seran capaces de administrar terapia personalizada para maximizar la eficacia de los farmacos y para minimizar el riesgo de una respuesta adversa a farmacos. Similarmente, la determinacion del proyecto de los organismos patogenos puede conducir a nuevos tratamientos para enfermedades infecciosas y supervision de patogenos mas robusta. La secuenciacion de ADN del genoma completo proporcionara la base para la medicina moderna.
La secuenciacion de ADN es el proceso de determinacion del orden de los constituyentes qmmicos de un polfmero de ADN dado. Estos constituyentes qmmicos, que se llaman nucleotidos, existen en el ADN en cuatro formas comunes: desoxiadenosina (A), desoxiguanosina (G), desoxicitidina (C) y desoxitimidina (T). La secuenciacion de un genoma humano diploide requiere determinar el orden secuencial de aproximadamente 6 billones de nucleotidos.
Actualmente, la mayor parte de la secuenciacion de ADN se realiza usando el metodo de terminacion de cadenas desarrollado por Frederick Sanger. Esta tecnica, llamada secuenciacion de Sanger, usa la terminacion espedfica de secuencia de la smtesis de ADN y sustratos indicadores de nucleotidos fluorescentemente modificados para derivar la informacion de secuencias. Este metodo secuencia una hebra de acido nucleico diana, o longitud de lectura, de hasta 1000 bases de longitud usando una reaccion en cadena de la polimerasa modificada. En esta reaccion modificada la secuenciacion se interrumpe aleatoriamente en tipos de bases seleccionados (A, C, G o T) y las longitudes de las secuencias interrumpidas se determinan por electroforesis en gel capilar. La longitud determina entonces que tipo de base esta localizado en esa longitud. Se producen muchas longitudes de lectura solapantes y sus secuencias se solapan usando procesamiento de datos para determinar el ajuste mas fiable de los datos. Este proceso de produccion de longitudes de lectura de secuencia es muy laborioso y caro y ahora esta siendo sustituido por metodos nuevos que tienen mayor eficiencia.
Se uso el metodo de Sanger para proporcionar la mayona de los datos de secuencia en el Proyecto Genoma Humano que genero la primera secuencia completa del genoma humano. Este proyecto tuvo lugar durante 10 anos y casi 3 billones de dolares para completarse. Dadas estas significativas limitaciones de rendimiento y coste, es evidente que las tecnologfas de secuenciacion de ADN necesitaran mejorar drasticamente con el fin de lograr los objetivos establecidos propuestos por la comunidad cientffica. Para este fin, varias tecnologfas de segunda generacion, que superaron con creces las limitaciones basicas de rendimiento y coste de la secuenciacion de Sanger, estan consiguiendo una cuota cada vez mayor del mercado de la secuenciacion. Todavfa estos metodos de “secuenciacion por smtesis” se quedan cortos en lograr los objetivos de rendimiento, coste y calidad requeridos por los mercados tales como la secuencia del genoma completo para la medicina personalizada.
Por ejemplo, 454 Life Sciences esta produciendo instrumentos (por ejemplo, el secuenciador del genoma) que puede procesar 100 millones de bases en 7,5 horas con una longitud de lectura promedio de 200 nucleotidos. Su enfoque usa una variacion de la reaccion en cadena de la polimerasa (“PCR”) para producir una colonia homogenea de acido nucleico diana, cientos de bases en longitud, sobre la superficie de una perla. Este proceso se llama PCR en emulsion. Cientos de miles de tales perlas estan entonces dispuestas sobre una “placa de picotftulo”. La placa se prepara entonces para una secuenciacion adicional por la cual cada tipo de base de acido nucleico se lava secuencialmente sobre la placa. Las perlas con diana que incorporan la base producen un subproducto de pirofosfato que puede usarse para catalizar una reaccion que produce luz que entonces se detecta con una camara.
Illumina Inc. tiene un proceso similar que usa nucleotidos de terminacion reversible y marcas fluorescentes para realizar la secuenciacion de acidos nucleicos. La longitud de lectura promedio para el analizador 1G de Illumina es
5
10
15
20
25
30
35
40
45
50
55
60
inferior a 40 nucleotidos. En lugar de usar PCR en emulsion para amplificar dianas de secuencia, Illumina tiene un enfoque para amplificar colonias por PCR sobre una superficie de matriz. Tanto los enfoques 454 como de Illumina usan una complicada amplificacion por polimerasa para aumentar la intensidad de la senal, realizan mediciones de bases durante el ciclo de extension de la secuencia limitante de la tasa y tienen longitudes de lectura limitadas debido a los errores de incorporacion que degradan la senal de medicion con respecto al ruido proporcionalmente a la longitud de lectura.
Applied Biosystems usa ligacion de terminacion reversible en vez de secuenciacion por smtesis para leer el ADN. Al igual que el secuenciador del genoma 454, la tecnologfa usa PCR en emulsion basada en perlas para amplificar la muestra. Como la mayona de las perlas no llevan productos de PCR, los investigadores usan a continuacion una etapa de enriquecimiento para seleccionar perlas recubiertas con ADN. Las perlas recubiertas con biotina se extienden y se inmovilizan sobre una matriz de portaobjetos de vidrio cubierta con estreptavidina. A continuacion, las perlas inmovilizadas se ejecutan a traves de un proceso de hibridacion de sondas 8-meras (cada una marcada con cuatro colorantes fluorescentes diferentes), ligacion y escision (entre las bases 5a y 6a para crear un sitio para la siguiente ronda de ligacion). Cada sonda interroga a dos bases, en las posiciones 4 y 5, usando un sistema que codifica 2 bases, que se registra por una camara. Similar al enfoque de Illumina, la longitud de lectura promedio para la plataforma Solid de Applied Biosystems es inferior a 40 nucleotidos.
Estan siendo desarrollados otros enfoques para evitar el tiempo y gasto de la etapa de amplificacion de la polimerasa midiendo moleculas individuales de ADN directamente. Visigen Biotechnologies, Inc. esta midiendo bases fluorescentemente marcadas a medida que se secuencian incorporando un segundo fluoroforo en una ADN polimerasa manipulada por ingeniena y usando transferencia de energfa de resonancia de Forster (FRET) para la identificacion de nucleotidos. Esta tecnica se enfrenta a los retos de separar las senales de bases que estan separadas por menos de un nanometro y por una accion de incorporacion de polimerasa que tendra variacion estadfstica muy grande.
Un proceso que es desarrollado por LingVitae secuencia ADNc insertado en vectores plasirndicos inmovilizados. El proceso usa una enzima de restriccion de clase IIS para escindir el acido nucleico diana y ligar un oligomero en la diana. Normalmente, uno o dos nucleotidos en los nucleotidos protuberante de 5' o 3' terminales generados por la enzima de restriccion determinan cual de una biblioteca de oligomeros en la mezcla de ligacion se anadira al extremo cortado pegajoso de la diana. Cada oligomero contiene secuencias “senal” que identifican unicamente al (a los) nucleotido(s) que sustituye. Entonces se repite el proceso de escision y ligacion. La nueva molecula se secuencia entonces usando marcas espedficas para los diversos oligomeros. El producto de este proceso se llama un “polfmero de diseno” y siempre consiste en un acido nucleico mas largo que uno al que sustituye (por ejemplo, una secuencia diana de dinucleotido esta sustituida con una secuencia de polinucleotidos “ampliada” de nada menos que 100 pares de bases). Una ventaja de este proceso es que la hebra del producto de duplex puede amplificarse si se desea. Una desventaja es que el proceso es necesariamente dclico y la continuidad del molde se perdena si se hicieran multiples cortes de restriccion simultaneos.
La patente de EE.UU. N°. 7.060.440 a Kless describe un proceso de secuenciacion que implica incorporar oligomeros por polimerizacion con una polimerasa. Se usa una modificacion del metodo de Sanger, con oligomeros terminados en el extremo como sustratos, para construir escaleras de secuenciacion por electroforesis en gel o cromatograffa capilar. Aunque el acoplamiento de oligomeros por ligacion de extremos es muy conocido, el uso de una polimerasa para acoplar oligomeros en un proceso dirigido por molde se utilizo como una nueva ventaja.
Se espera que las tecnicas de polimerizacion crezcan en potencia a medida que las polimerasas modificadas (y ligasas) esten disponibles mediante ingeniena genetica y bioprospeccion, y ya se conocen metodos de eliminacion de actividad de exonucleasa por modificacion de polimerasas. Por ejemplo, la solicitud de patente de EE.UU. publicada 2007/0048748 a Williams describe el uso de polimerasas mutantes para incorporar nucleotidos marcados con colorante y otros nucleotidos modificados. Los sustratos para estas polimerasas tambien incluyen nucleotidos marcados con y-fosfato. Se encontraron tanto elevada velocidad de incorporacion como reduccion en la tasa de error con polimerasas quimericas y mutantes.
Ademas, se ha hecho un gran esfuerzo por tanto equipos academicos como industriales para secuenciar ADN nativo usando metodos no sinteticos. Por ejemplo, Agilent Technologies, Inc. junto con colaboradores universitarios, estan desarrollando un metodo de deteccion de una unica molecula que bobina el ADN a traves de un nanoporo para hacer mediciones a medida que pasa a su traves. Al igual que con Visigen y LingVitae, este metodo debe vencer el problema de obtener eficazmente y con exactitud distintas senales de nucleobases individuales separadas por dimensiones sub-nanometricas, ademas del problema de desarrollar tamanos de poro reproducibles de tamano similar. Como tal, la secuenciacion directa de ADN por deteccion de sus partes constituyentes tiene ahora que lograrse en un proceso de alto rendimiento debido al pequeno tamano de los nucleotidos en la cadena (aproximadamente 4 Angstroms de centro a centro) y las limitaciones de la resolucion de senal con respecto a ruido y de senales correspondientes a este respecto. La deteccion directa se complica adicionalmente por la estructura secundaria inherente del ADN, que no se alarga facilmente en un polfmero perfectamente lineal.
Aunque se han hecho avances significativos en el campo de la secuenciacion de ADN, continua siendo una necesidad en la materia metodos nuevos y mejorados. La presente invencion cumple estas necesidades y
5
10
15
20
25
30
35
40
45
50
proporciona otras ventajas relacionadas.
El documento US 2002/028458 A1 desvela un metodo de secuenciacion de toda o parte de una molecula de acido nucleico diana que determina la secuencia de una porcion de dicha molecula de acido nucleico, ademas de informacion referente a la posicion de dicha porcion, y en particular proporciona un nuevo metodo de secuenciacion que implica el aumento de una o mas bases de dichas bases para ayudar en la identificacion.
El documento WO 00/79257 A desvela un metodo de evaluacion de una molecula de polfmero que incluye residuos de monomero linealmente conectados. Dicho metodo incluye proporcionar una molecula de polfmero en un lfquido, poner en contacto el lfquido con una membrana en estado solido aislante que tiene un detector capaz de detectar caractensticas de la molecula de polfmero, y hacer que la molecula de polfmero atraviese una region limitada de la membrana en estado solido de manera que monomeros de la molecula de polfmero atraviesen el lfmite en orden secuencial, por lo que la molecula de polfmero interacciona linealmente con el detector y se obtienen datos adecuados para determinar las caractensticas de la molecula de polfmero.
El documento WO 2006/076650 A2 desvela composiciones, metodos y kits para amplificar y detectar selectivamente secuencias diana. En algunas realizaciones se desvelan una sonda circularizable y/o un par de sondas para amplificar selectivamente secuencias diana.
Breve resumen
En terminos generales, se desvelan metodos y dispositivos correspondientes y productos que vencen los retos de resolucion espacial por tecnicas de secuenciacion de acidos nucleicos de alto rendimiento existentes. Esto se logra codificando la informacion del acido nucleico en un polfmero sustituto de longitud extendida que es mas facil de detectar. El polfmero sustituto (denominado en el presente documento un “Xpandomero”) se forma por smtesis dirigida por molde que preserva la informacion genetica original del acido nucleico diana, mientras que tambien aumenta la separacion lineal de los elementos individuales de los datos de secuencia.
En una realizacion, se desvela un metodo para la secuenciacion de un acido nucleico diana, que comprende: a) proporcionar una hebra hija producida por una smtesis dirigida por molde, comprendiendo la hebra hija una pluralidad de subunidades acopladas en una secuencia correspondiente a una secuencia de nucleotidos contigua de toda o una porcion del acido nucleico diana, en el que las subunidades individuales comprenden un anclaje, al menos una sonda o residuo de nucleobase, y al menos un enlace selectivamente escindible; b) escindir el al menos un enlace selectivamente escindible para dar un Xpandomero de una longitud mayor que la pluralidad de las subunidades de la hebra hija, comprendiendo el Xpandomero los anclajes y elementos indicadores para analizar la informacion genetica en una secuencia correspondiente a la secuencia de nucleotidos contigua de toda o una porcion del acido nucleico diana; y c) detectar los elementos indicadores del Xpandomero.
En mas realizaciones espedficas, los elementos indicadores para analizar la informacion genetica pueden asociarse a los anclajes del Xpandomero, con la hebra hija antes de la escision del al menos un enlace selectivamente escindible, o con el Xpandomero despues de la escision del al menos un enlace selectivamente escindible. El Xpandomero puede comprender ademas toda o una porcion de la al menos una sonda o residuo de nucleobase, y los elementos indicadores para analizar la informacion genetica pueden asociarse a la al menos una sonda o residuo de nucleobase o pueden ser ellos mismos la sonda o residuos de nucleobase. Ademas, el enlace selectivamente escindible puede ser un enlace covalente, un enlace intra-anclaje, un enlace entre o dentro de las sondas o residuos de nucleobase de la hebra hija, y/o un enlace entre las sondas o residuos de nucleobase de la hebra hija y un molde diana.
En otras realizaciones, los Xpandomeros tienen las siguientes estructuras (I) a (X):
Estructura (I):
en la que
imagen1
T representa el anclaje;
P1 representa un primer resto de sonda;
P2 representa un segundo resto de sonda;
k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres; y
a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana.
5
10
15
20
25
30
35
Estructura (II):
imagen2
en la que
T representa el anclaje;
P1 representa un primer resto de sonda;
P2 representa un segundo resto de sonda;
k representa la subunidad kn en una cadena de m subunidades, en la que m es un tres;
a representa una especie de un motivo de subunidad seleccionado de una biblioteca en la que cada una de las especies comprende informacion de secuencias de la contigua de una porcion del acido nucleico diana; y
X representa un enlace con el anclaje de una subunidad adyacente.
Estructura (III):
imagen3
en la que
T representa el anclaje;
P1 representa un primer resto de sonda;
P2 representa un segundo resto de sonda;
k representa la subunidad kn en una cadena de m subunidades, en la que m es un tres;
a representa una especie de un motivo de subunidad seleccionado de una biblioteca en la que cada una de las especies comprende informacion de secuencias de la contigua de una porcion del acido nucleico diana; y
X representa un enlace con el anclaje de una subunidad adyacente.
Estructura (IV):
imagen4
en la que
T representa el anclaje;
P1 representa un primer resto de sonda;
P2 representa un segundo resto de sonda;
k representa la subunidad kn en una cadena de m subunidades, en la que m es un tres;
a representa una especie de un motivo de subunidad seleccionado de una biblioteca en la que cada una de las especies comprende informacion de secuencias de la contigua de una porcion del acido nucleico diana; y
numero entero superior a
de motivos de subunidad, secuencia de nucleotidos
numero entero superior a
de motivos de subunidad, secuencia de nucleotidos
numero entero superior a
de motivos de subunidad, secuencia de nucleotidos
5
10
15
20
25
30
X representa un enlace con el anclaje de una subunidad adyacente. Estructura (V):
a
imagen5
K
en la que
T representa el anclaje;
X representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres;
a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
X representa un enlace con el anclaje de una subunidad adyacente.
Estructura (VI):
imagen6
en la que
T representa el anclaje;
N representa un residuo de nucleobase;
k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
X representa un enlace con el anclaje de una subunidad adyacente.
Estructura (VII):
imagen7
en la que
T representa el anclaje;
k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
X representa un enlace con el anclaje de una subunidad adyacente.
5
10
15
20
25
30
Estructura (VIII):
en la que
imagen8
T representa el anclaje;
N representa un residuo de nucleobase;
k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
a, representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
X representa un enlace con el anclaje de una subunidad adyacente.
Estructura (IX):
imagen9
en la que
T representa el anclaje;
N representa un residuo de nucleobase;
k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana;
X representa un enlace con el anclaje de una subunidad adyacente; y
X2 representa un enlace inter-anclaje.
Estructura (X):
imagen10
imagen11
en la que
T representa el anclaje;
n1 y n2 representa una primera porcion y una segunda porcion, respectivamente, de un residuo de nucleobase;
k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez; y
a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana.
Ademas, se desvelan construcciones de sustrato de oligomero para su uso en una smtesis dirigida por molde para la secuenciacion de un acido nucleico diana.
Las construcciones de sustrato de oligomero comprenden un primer resto de sonda unido a un segundo resto de sonda, teniendo cada uno del primer y segundo restos de sonda un grupo terminal adecuado para la smtesis dirigida
5
10
15
20
25
30
35
40
45
50
55
60
por molde, y un anclaje que tiene un primer extremo y un segundo extremo con al menos el primer extremo del anclaje unido a al menos uno del primer y segundo restos de sonda, en las que la construccion de sustrato de oligomero cuando se usa en la smtesis dirigida por molde es capaz de formar una hebra hija que comprende un Xpandomero limitado y que tiene una pluralidad de subunidades acopladas en una secuencia correspondiente a la secuencia de nucleotidos contigua de toda o una porcion del acido nucleico diana, en las que las subunidades individuales comprenden un anclaje, el primer y segundo restos de sonda y al menos un enlace selectivamente escindible.
Ademas, se desvelan construcciones de sustrato de oligomero para su uso en una smtesis dirigida por molde para la secuenciacion de un acido nucleico diana. Las construcciones de sustrato de oligomero comprenden un residuo de nucleobase con grupos terminales adecuados para la smtesis dirigida por molde, y un anclaje que tiene un primer extremo y un segundo extremo con al menos el primer extremo del anclaje unido al residuo de nucleobase, en las que la construccion de sustrato de monomero cuando se usa en la smtesis dirigida por molde es capaz de formar una hebra hija que comprende un Xpandomero limitado y que tiene una pluralidad de subunidades acopladas en una secuencia correspondiente a la secuencia de nucleotidos contigua de toda o una porcion del acido nucleico diana, en la que las subunidades individuales comprenden un anclaje, el residuo de nucleobase y al menos un enlace selectivamente escindible.
Ademas, se desvelan duplex de molde-hebra hija que comprenden una hebra hija duplexada con una hebra molde, ademas de a metodos de formacion de los mismos a partir de la hebra molde y el oligomero o las construcciones de sustrato de oligomero.
Estos y otros aspectos de la invencion seran evidentes tras la referencia a los dibujos adjuntos y tras la descripcion detallada. Para este fin, se exponen diversas referencias en el presente documento que describen en mas detalle ciertos procedimientos, compuestos y/o composiciones.
Breve descripcion de los dibujos
En las figuras, numeros de referencia identicos identifican elementos similares. Los tamanos y posiciones relativas de los elementos en las figuras no estan necesariamente dibujados a escala y algunos de estos elementos estan arbitrariamente ampliados y posicionados para mejorar la legibilidad de la figura. Ademas, las formas particulares de los elementos como estan dibujados no pretenden expresar ninguna informacion referente a la forma actual de los elementos particulares, y han sido unicamente seleccionadas para facilitar el reconocimiento en las figuras.
Las Figuras 1A y 1B ilustran la separacion limitada entre nucleobases que debe resolverse con el fin de determinar la secuencia de nucleotidos en una diana de acido nucleico.
Las Figuras 2A a 2D ilustran esquematicamente varias estructuras representativas de sustratos utiles en la invencion.
Las Figuras 3A, 3B y 3C son esquemas que ilustran etapas simplificadas para sintetizar un Xpandomero de un acido nucleico diana.
La Figura 4 es un simple modelo que ilustra un dispositivo tipo nanoporo de FRET para la secuenciacion de un Xpandomero.
La Figura 5 es un grafico con canales para emisiones de fluorescencia roja, verde y azul, e ilustra como pueden descodificarse senales analogas en informacion digital que se corresponde con la informacion genetica de secuencias codificadas en un Xpandomero. La tabla adjunta (Figura 6) muestra como los datos se descodifican. Empleando tres fluoroforos de multi-estado, la secuencia de bases puede leerse con alta resolucion en forma digital a partir de una unica molecula en tiempo real a medida que el Xpandomero se bobina a traves del nanoporo.
La Figura 6 es una tabla de consulta de la que se derivan los datos de la Figura 5.
Las Figuras 7A-E son geles de productos de ligacion.
La Figura 8 es una vision general de Xpandomeros oligomericos.
La Figura 9 es una vision general de Xpandomeros monomericos.
Las Figuras 10A a 10E representan Xpandomeros de clase I, productos intermedios y precursores en una forma simbolica y grafica. Estos precursores se llaman Xsondas si son monofosfatos y Xmeros si son trifosfatos.
La Figura 11 es un esquema condensado de un metodo de smtesis de un Xpandomero por ligacion en disolucion usando un cebador en horquilla terminado en los extremos y construcciones de sustrato de clase I.
La Figura 12 es un esquema condensado de un metodo de smtesis de un Xpandomero por ligacion en
disolucion usando un cebador en horquilla de extremo doble y construcciones de sustrato de clase I.
La Figura 13 es un esquema condensado de un metodo de smtesis de un Xpandomero por ligacion sobre un molde inmovilizado, sin cebadores, usando construcciones de sustrato de clase I.
La Figura 14 es un esquema condensado de un metodo de smtesis de un Xpandomero por ligacion escalonada dclica usando construcciones de sustrato de clase I reversiblemente terminadas sobre moldes hibridados para cebadores inmovilizados.
La Figura 15 es un esquema condensado de un metodo de smtesis de un Xpandomero por ensamblaje
promiscuo y acoplamiento qrnmico usando construcciones de sustrato de clase I sin cebadores.
La Figura 16 es un esquema condensado de un metodo de smtesis de un Xpandomero por polimerizacion en
5
10
15
20
25
30
35
40
45
50
55
60
65
disolucion usando un cebador en horquilla y construcciones de sustrato de trifosfato de clase I.
La Figura 17 es un esquema condensado de un metodo de smtesis de un Xpandomero sobre un molde inmovilizado usando construcciones de sustrato de trifosfato de clase I y una polimerasa.
Las Figuras 18A a 18E representan un Xpandomero de clase II, producto intermedio de Xpandomero y construccion de sustrato en un lenguaje simbolico y grafico.
Las Figuras 19A a 19E representan un Xpandomero de clase III, producto intermedio de Xpandomero y construccion de sustrato en un lenguaje simbolico y grafico.
La Figura 20 es un esquema condensado de un metodo de smtesis de un Xpandomero sobre un molde
inmovilizado usando construcciones de sustrato de clase II que combinan hibridacion y acoplamiento qrnmico
sin cebador.
La Figura 21 es un esquema condensado de un metodo de smtesis de un Xpandomero sobre un molde
inmovilizado usando un cebador, construcciones de sustrato de clase II y una ligasa.
Las Figuras 22A a 22E representan un Xpandomero de clase IV, producto intermedio de Xpandomero y construccion de sustrato en una forma simbolica y grafica.
Las Figuras 23A a 23E representan un Xpandomero de clase V, producto intermedio de Xpandomero y construccion de sustrato en una forma simbolica y grafica.
La Figura 24 es un esquema condensado de un metodo de smtesis de un Xpandomero por polimerizacion en disolucion usando un cebador de adaptamero y construcciones de sustrato de trifosfato de clase V.
La Figura 25 ilustra estructuras de desoxiadenosina (A), desoxicitosina (C), desoxiguanosina (G) y desoxitimidina (T).
Las Figuras 26A y 26B ilustran nucleotidos derivatizados con grupos funcionales.
Las Figuras 27A y 27B ilustran miembros de sonda que incorporan nucleobases derivatizadas.
Las Figuras 28A a 28D ilustran en mas detalle sustratos de clase I-IV de la invencion, que muestran aqrn ejemplos de sitios de escision de enlaces selectivamente escindibles en el esqueleto de sonda y que indican enlaces del extremo de bucle que conectan los sitios de escision.
Las Figuras 29A a 29D ilustran en mas detalle sustratos de clase I-IV de la invencion, que muestran aqrn ejemplos de sitios de escision de enlaces selectivamente escindibles en el esqueleto de sonda y que indican enlaces del extremo de bucle que conectan los sitios de escision.
La Figura 30 ilustra un metodo de ensamblaje de una construccion “sonda-bucle”, tal como una Xsonda o un Xmero.
La Figura 31 ilustra un metodo de ensamblaje de una construccion de sustrato de clase I, en la que el bucle contiene construcciones de indicador.
Las Figuras 32A a 32C ilustran el uso de PEG como anclaje polimerico.
Las Figuras 33A a 33D ilustran poli-lisina como anclaje polimerico y construcciones dendnmeras derivadas de andamiajes de poli-lisina.
Las Figuras 34a a 34C ilustran metodos seleccionados de cierre del bucle de anclaje integrados con el ensamblaje de construccion de indicador de segmentos.
Las Figuras 35A y 35B ilustran un metodo de smtesis de un segmento de indicador individual por polimerizacion aleatorizada de bloques precursores.
Las Figuras 36A a 36I ilustran construcciones de indicador.
La Figura 37 es una tabla que muestra la composicion y metodos qmmicos para ensamblar construcciones de indicador y sus codigos de indicador correspondientes.
Las Figuras 38A a 38F son adaptadores adecuados para su uso en la funcionalizacion de extremos de acidos nucleicos diana.
La Figura 39 es un casete de adaptador para introducir un grupo funcional ANH terminal sobre un molde de ADNbc.
La Figura 40 es un esquema para inmovilizar y preparar un molde para la smtesis de un Xpandomero.
Las Figuras 41A a 41E ilustran metodos de estiramiento ffsico seleccionados.
Las Figuras 42A a 42C ilustran metodos de electroestiramiento seleccionados.
Las Figuras 43A a 43D ilustran metodos, reactivos y adaptadores para el estiramiento en matrices de gel.
Las Figuras 44A a 44C describe la construccion y uso de “marcas de arrastre”.
La Figura 45 describe un metodo promiscuo basado en hibridacion/ligacion para sintetizar un Xpandomero.
Las Figuras 46A y B describen nucleobases usadas para llenar huecos.
Las Figuras 47A y B describen simulaciones de la aparicion de huecos.
Las Figuras 48A y B describen simulaciones de la aparicion de huecos.
La Figura 49 ilustra como los huecos se llenan con 2meros y 3meros.
Las Figuras 50A y B describen simulaciones del llenado de huecos usando combinaciones de 2meros y 3meros.
La Figura 51 ilustra el uso de adyuvantes 2meros y 3meros para romper la estructura secundaria.
La Figura 52 describe bases utiles como adyuvantes.
La Figura 53 describe sustituciones de nucleotidos usadas para reducir la estructura secundaria.
La Figura 54 describe un modelo de deteccion de nanoporos con transporte de perlas magneticas.
La Figura 55 ilustra un metodo de deteccion de nanoporos convencional.
La Figura 56 ilustra un metodo de deteccion de nanoporos de electrodos transversos.
La Figura 57 ilustra un metodo de deteccion microscopica.
La Figura 58 ilustra la deteccion por microscopfa electronica.
5
10
15
20
25
30
35
40
45
50
55
La Figura 59 ilustra la deteccion usando microscopfa de fuerza atomica.
Las Figuras 60A a 60E representan un Xpandomero de clase VI, producto intermedio de Xpandomero y construccion de sustrato en un lenguaje simbolico y grafico. Estos precursores se llaman RT-NTP.
La Figura 61 es un esquema condensado de un metodo de smtesis de un Xpandomero sobre un molde inmovilizado usando construcciones de sustrato de trifosfato de clase VI reversiblemente terminadas y una polimerasa.
Las Figuras 62A a 62E representan un Xpandomero de clase VII, producto intermedio de Xpandomero y construccion de sustrato en un lenguaje simbolico y grafico. Estos precursores se llaman RT-NTP.
Las Figuras 63A a 63E representan un Xpandomero de clase VIII, producto intermedio de Xpandomero y construccion de sustrato en un lenguaje simbolico y grafico. Estos precursores se llaman RT-NTP.
Las Figuras 64A a 64E representan un Xpandomero de clase IX, producto intermedio de Xpandomero y construccion de sustrato en un lenguaje simbolico y grafico. Estos precursores se llaman RT-NTP.
La Figura 65 es un esquema condensado de un metodo de smtesis de un Xpandomero sobre un molde inmovilizado usando construcciones de sustrato de trifosfato de clase IX y una polimerasa.
Las Figuras 66A a 66E representan un Xpandomero de clase X, producto intermedio de Xpandomero y construccion de sustrato en un lenguaje simbolico y grafico. Estos precursores se llaman XNTP.
La Figura 67 es un esquema condensado de un metodo de smtesis de un Xpandomero por polimerizacion en disolucion usando un cebador en horquilla y construcciones de sustrato de trifosfato de clase X.
Descripcion detallada
En la siguiente descripcion se exponen ciertos detalles espedficos con el fin de proporcionar un entendimiento riguroso de diversas realizaciones. Sin embargo, un experto en la materia entendera que la invencion puede ponerse en practica sin estos detalles. En otros casos, estructuras muy conocidas no se han mostrado o descrito en detalle para evitar descripciones innecesariamente ilegibles de las realizaciones. A menos que el contexto requiera de otro modo, en toda la memoria descriptiva y reivindicaciones que siguen, la palabra “comprenden” y variaciones de la misma, tales como “comprende” y “que comprende”, deben interpretarse en un sentido incluyente abierto, es decir, como “que incluye, pero no se limitan a”. Ademas, los encabezados en el presente documento se proporcionan para comodidad solo y no interpretan el alcance o significado de la invencion reivindicada.
Referencia en toda esta memoria descriptiva a “una realizacion” significa que una caractenstica particular, estructura o caractenstica descrita a proposito de la realizacion se incluye en al menos una realizacion. Asf, las apariciones de la expresion “en una realizacion” en diversos sitios en toda esta memoria descriptiva no son todas necesariamente con referencia a la misma realizacion. Ademas, las caractensticas particulares, estructuras o caractensticas pueden combinarse de cualquier manera adecuada en una o mas realizaciones. Por tanto, como se usa en esta memoria descriptiva y las reivindicaciones adjuntas, las formas en singular “un”, “una”, “el” y “la” incluyen referentes plurales, a menos que el contenido imponga claramente de otro modo. Debe tambien observarse que el termino “o” se emplea generalmente en su sentido que incluye “y/o”, a menos que el contenido imponga claramente de otro modo.
Definiciones
Como se usa en el presente documento, y a menos que el contexto imponga de otro modo, los siguientes terminos tienen los significados que se especifican a continuacion.
“Nucleobase” es una base heterodclica tal como adenina, guanina, citosina, timina, uracilo, inosina, xantina, hipoxantina, o un derivado heterodclico, analogo o tautomero de la misma. Una nucleobase puede existir de forma natural o sintetica. Ejemplos no limitantes de nucleobases son adenina, guanina, timina, citosina, uracilo, xantina, hipoxantina, 8-azapurina, purinas sustituidas en la posicion 8 con metilo o bromo, 9-oxo-N6-metiladenina, 2- aminoadenina, 7-deazaxantina, 7-deazaguanina, 7-deaza-adenina, N4-etanocitosina, 2,6-diaminopurina, N6-etano- 2,6-diaminopurina, 5-metilcitosina, 5-alquinil (C3-C6)-citosina, 5-fluorouracilo, 5-bromouracilo, tiouracilo, pseudoisocitosina, 2-hidroxi-5-metil-4-triazolopiridina, isocitosina, isoguanina, inosina, 7,8-dimetilaloxazina, 6- dihidrotimina, 5,6-dihidrouracilo, 4-metil-indol, etenoadenina y las nucleobases que no existen de forma natural descritas en las patentes de EE.UU. N° 5.432.272 y 6.150.510 y solicitudes PCT WO 92/002258, WO 93/10820, WO 94/22892 y WO 94/24144, y Fasman (“Practical Handbook of Biochemistry and Molecular Biology”, pp. 385-394, 1989, CRC Press, Boca Raton, LO).
“Residuo de nucleobase” incluye nucleotidos, nucleosidos, fragmentos de los mismos, y moleculas relacionadas que tienen la propiedad de unirse a un nucleotido complementario. Desoxinucleotidos y ribonucleotidos, y sus diversos analogos, se contemplan dentro del alcance de esta definicion. Los residuos de nucleobase pueden ser miembros de oligomeros y sondas. “Nucleobase” y “residuo de nucleobase” pueden usarse indistintamente en el presente documento y generalmente son sinonimos, a menos que el contexto imponga de otro modo.
“Polinucleotidos”, tambien llamados acidos nucleicos, son series covalentemente enlazadas de nucleotidos en los que la posicion 3' de la pentosa de un nucleotido se une por un grupo fosfodiester a la posicion 5' del siguiente. El ADN (acido desoxirribonucleico) y el ARN (acido ribonucleico) son polinucleotidos que se producen biologicamente en los que los residuos de nucleotidos estan enlazados en una secuencia espedfica por enlaces fosfodiester. Como se usa en el presente documento, los terminos “polinucleotido” o “oligonucleotido” engloban cualquier compuesto de
5
10
15
20
25
30
35
40
45
50
55
poKmero que tiene un esqueleto lineal de nucleotidos. Los oligonucleotidos, tambien llamados oligomeros, son polinucleotidos de cadena generalmente mas corta.
“Complementario” generalmente se refiere al duplexado de nucleotidos espedficos para formar pares de bases canonicas de Watson-Crick, como se entiende por aquellos expertos en la materia. Sin embargo, complementario como se denomina en el presente documento tambien incluye apareamiento de bases de analogos de nucleotidos, que incluyen, pero no se limitan a, 2'-desoxiinosina y 5-nitroindol-2-desoxiribosdio, que son capaces de apareamiento de bases universal con nucleotidos A, T, G o C y acidos nucleicos bloqueados, que potencian la estabilidad termica de los duplex. Un experto en la materia reconocera que la rigurosidad de hibridacion es un determinante en el grado de apareamiento o desapareamiento del duplex formado por hibridacion.
“Acido nucleico” es un polinucleotido o un oligonucleotido. Una molecula de acido nucleico puede ser acido desoxirribonucleico (ADN), acido ribonucleico (ARN), o una combinacion de ambos. Los acidos nucleicos se denominan generalmente “acidos nucleicos diana” o “secuencia diana” si son elegidos como diana para la secuenciacion. Los acidos nucleicos pueden ser mezclas o conjuntos de moleculas elegidos como diana para la secuenciacion.
“Sonda” es una hebra corta de residuos de nucleobase, que se refiere generalmente a dos o mas residuos de nucleobase contiguos que son generalmente monocatenarios y complementarios a una secuencia diana de un acido nucleico. Como se integra en “Miembros de sustrato” y “Construcciones de sustrato”, las sondas pueden tener hasta 20 residuos de nucleobase de longitud. Las sondas pueden incluir residuos de nucleobase modificados y enlaces intra-nucleobase modificados en cualquier combinacion. Los esqueletos de sondas pueden ligarse juntos por cualquiera de varios tipos de enlaces covalentes, que incluyen, pero no se limitan a, enlace ester, fosfodiester, fosforamida, fosfonato, fosforotioato, fosforotiolato, amida y cualquier combinacion de los mismos. La sonda tambien puede tener enlaces de los extremos 5' y 3' que incluyen, pero no se limitan a, los siguientes restos: monofosfato, trifosfato, hidroxilo, hidrogeno, ester, eter, glicol, amina, amida y tioester.
“Hibridacion selectiva” se refiere a la union complementaria espedfica. Polinucleotidos, oligonucleotidos, sondas, residuos de nucleobase y fragmentos de los mismos se hibridan selectivamente con hebras de acido nucleico diana, bajo condiciones de hibridacion y de lavado que minimizan la union no espedfica. Como se conoce en la tecnica, pueden usarse condiciones de alta rigurosidad para lograr condiciones de hibridacion selectivas que favorecen un apareamiento perfecto. Condiciones para la hibridacion tales como concentracion de sales, temperatura, detergentes, PEG y agentes neutralizantes de GC tales como betama pueden variarse para aumentar la rigurosidad de la hibridacion, es decir, el requisito de apareamientos exactos de C para el apareamiento de bases con G, y A para el apareamiento de bases con T o U, junto con una hebra contigua de un acido nucleico de duplex.
“Smtesis dirigida por molde”, “ensamblaje dirigido por molde”, “hibridacion dirigida por molde”, “union dirigida por molde” y cualquier otro proceso dirigido por molde se refieren a un proceso por el cual los residuos de nucleobase o sondas se unen selectivamente a un acido nucleico diana complementario, y se incorporan en una hebra hija naciente. Una hebra hija producida por una smtesis dirigida por molde es complementaria a la diana monocatenaria a partir de la que se sintetiza. Debe observarse que la secuencia correspondiente de una hebra diana puede deducirse de la secuencia de su hebra hija, si esta es conocida. “Polimerizacion dirigida por molde” y “ligacion dirigida por molde” son casos especiales de la smtesis dirigida por molde por las cuales la hebra hija resultante se polimeriza o se liga, respectivamente.
“Contigua” indica que una secuencia continua sin interrupcion o nucleobase ausente. La secuencia contigua de nucleotidos de la hebra molde se dice que es complementaria a la secuencia contigua de la hebra hija.
“Sustratos” o “miembros de sustrato” son oligomeros, sondas o residuos de nucleobase que tienen especificidad de union al molde diana. Los sustratos se combinan generalmente con anclajes para formar construcciones de sustrato. Sustratos de las construcciones de sustrato que forman el esqueleto primario de la hebra hija tambien son sustratos o miembros de sustrato de la hebra hija.
“Construcciones de sustrato” son reactivos para la smtesis dirigida por molde de hebras hijas, y se proporcionan generalmente en forma de bibliotecas. Las construcciones de sustrato generalmente contienen un miembro de sustrato para la union complementaria a un molde diana y tanto un miembro de anclaje como sitios de union de anclaje a los que puede unirse un anclaje. Las construcciones de sustrato se proporcionan en una variedad de formas adaptadas a la invencion. Las construcciones de sustrato incluyen tanto “construcciones de sustrato oligomerico” (tambien llamadas “construcciones de sustrato de sonda”) como “construcciones de sustrato monomerico” (tambien llamadas “construcciones de sustrato de nucleobase”).
“Motivo de subunidad” o “motivo” se refiere a una subunidad de repeticion de un esqueleto de polfmero, teniendo la subunidad una forma global caractenstica de las subunidades de repeticion, pero teniendo tambien elementos espedficos de especie que codifican informacion genetica. Los motivos de residuos de nucleobase complementarios se representan en bibliotecas de construcciones de sustrato segun el numero de posibles combinaciones de los elementos de nucleobase de union en la secuencia complementaria basica en cada motivo. Si los elementos de union de nucleobase son cuatro (por ejemplo, A, C, G y T), el numero de posibles motivos de combinaciones de
5
10
15
20
25
30
35
40
45
50
55
cuatro elementos es 4x, en la que x es el numero de residuos de nucleobase en el motivo. Sin embargo, otros motivos basados en bases de apareamiento degeneradas, en la sustitucion de uracilo por timidina en residuos de ribonucleobase u otros conjuntos de residuos de nucleobase, pueden conducir a mayores bibliotecas (o bibliotecas mas pequenas) de construcciones de sustrato que llevan motivo. Los motivos tambien se representan por construcciones de indicador espedficas de especie, tales como los indicadores que constituyen un anclaje de indicador. Generalmente hay una correlacion uno a uno entre el motivo de construccion de indicador que identifica una especie de sustrato particular y la complementariedad de union y especificidad del motivo.
“Producto intermedio de Xpandomero” es un producto intermedio (tambien denominado en el presente documento una “hebra hija”) ensamblado de construcciones de sustrato, y se forma por un ensamblaje dirigido por molde de construcciones de sustrato usando un molde de acido nucleico diana. Opcionalmente, se forman otros enlaces entre construcciones de sustrato confinadas que puede incluir polimerizacion o ligacion de los sustratos, enlaces anclaje a anclaje, o enlaces anclaje a sustrato. El producto intermedio de Xpandomero contiene dos estructuras; concretamente, el Xpandomero limitado y el esqueleto primario. El Xpandomero limitado comprende todos de los anclajes en la hebra hija, pero puede comprender todo, una porcion o nada del sustrato segun se requiera por el metodo. El esqueleto primario comprende todos los sustratos confinados. Bajo la etapa de proceso en la que el esqueleto primario se fragmenta o disocia, el Xpandomero limitado ya no esta limitado y es el producto de Xpandomero que se extiende a medida que los anclajes se estiran. “Hebra hija de duplex” se refiere a un producto intermedio de Xpandomero que se hibrida o se duplexa con el molde diana.
“Esqueleto primario” se refiere a un esqueleto contiguo o segmentado de sustratos de la hebra hija. Un esqueleto primario comunmente encontrado es el esqueleto de ribosil 5'-3' fosfodiester de un polinucleotido nativo. Sin embargo, el esqueleto primario de una hebra hija puede contener analogos de nucleobases y analogos de oligomeros no enlazados por enlaces fosfodiester o enlazados por una mezcla de enlaces fosfodiester y otros enlaces de esqueleto, que incluyen, pero no se limitan a, los siguientes enlaces: enlaces de esqueleto fosforotioato, fosforotiolato, fosfonato, fosforamidato y acido nucleico peptfdico “PNA” que incluyen fosfono-PNA, serina-PNA, hidroxiprolina-PNA, y combinaciones de los mismos. Si la hebra hija esta en su forma de duplex (es decir, hebra hija de duplex), y los sustratos no estan covalentemente unidos entre las subunidades, los sustratos son, sin embargo, contiguos y forman el esqueleto primario de la hebra hija.
“Xpandomero limitado” es un Xpandomero en una configuracion antes de haberse expandido. El Xpandomero limitado comprende todos los miembros de anclaje de la hebra hija. Esta limitado de expandirse por al menos un enlace o enlace por anclaje que se une al esqueleto primario. Durante el proceso de expansion, el esqueleto primario de la hebra hija se fragmenta o disocia para transformar el Xpandomero limitado en un Xpandomero.
“Esqueleto de Xpandomero limitado” se refiere al esqueleto del Xpandomero limitado. Es un esqueleto covalente sintetico co-ensamblado junto con el esqueleto primario en formacion de la hebra hija. En algunos casos, ambos esqueletos pueden no ser discretos, sino que ambos pueden tener el mismo sustrato o porciones del sustrato en su composicion. El esqueleto de Xpandomero limitado siempre comprende los anclajes, mientras que el esqueleto primario no comprende miembros de anclaje.
“Xpandomero” o “producto de Xpandomero” es una construccion molecular sintetica producida por la expansion de un Xpandomero limitado, que el mismo se sintetiza por ensamblaje dirigido por molde de construcciones de sustrato. El Xpandomero esta alargado con respecto al molde diana del que se produjo. Esta compuesto por una concatenacion de subunidades, cada subunidad un motivo, cada motivo un miembro de una biblioteca, que comprende informacion de secuencias, un anclaje y opcionalmente una porcion, o todo del sustrato, todos los cuales se derivan de la construccion de sustrato formativo. El Xpandomero se disena para expandirse para ser mayor que el molde diana, reduciendose asf la densidad lineal de la informacion de secuencias del molde diana a lo largo de su longitud. Ademas, el Xpandomero proporciona opcionalmente una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion. Mejor densidad de informacion lineal y senales mas fuertes aumentan la resolucion y reducen los requisitos de sensibilidad para detectar y descodificar la secuencia de la hebra molde.
“Enlace selectivamente escindible” se refiere a un enlace que puede romperse bajo condiciones controladas tales como, por ejemplo, condiciones para la escision selectiva de un enlace fosforotiolato, un enlace fotoescindible, un enlace fosforamida, un enlace 3'-O-B-D-ribofuranosilo-2', un enlace tioeter, un enlace selenoeter, un enlace sulfoxido, un enlace disulfuro, enlace desoxirribosil-5'-3' fosfodiester, o un enlace ribosil-5'-3' fosfodiester, ademas de otros enlaces escindibles conocidos en la tecnica. Un enlace selectivamente escindible puede ser un enlace intra- anclaje o entre o dentro de una sonda o un residuo de nucleobase o puede ser el enlace formado por hibridacion entre una sonda y una hebra molde. Los enlaces selectivamente escindibles no se limitan a enlaces covalentes, y pueden ser enlaces no covalentes o asociaciones, tales como aquellos basados en enlaces de hidrogeno, enlaces hidrofobos, enlaces ionicos, interacciones de apilamiento de anillos de enlace pi, interacciones de Van der Waals, y similares.
“Resto” es una de las dos o mas partes en las que algo puede dividirse, tal como, por ejemplo, las diversas partes de un anclaje, una molecula o una sonda.
5
10
15
20
25
30
35
40
45
50
55
60
“Anclaje” o “miembro de anclaje” se refiere a un poKmero o construccion molecular que tiene una dimension generalmente lineal y con un resto terminal en cada uno de los dos extremos opuestos. Un anclaje esta unido a un sustrato con un enlace en al menos un resto terminal para formar una construccion de sustrato. Los restos terminales del anclaje pueden conectarse a enlaces escindibles con el sustrato o enlaces intra-anclaje escindibles que sirven para limitar el anclaje en una “configuracion limitada”. Despues de sintetizar la hebra hija, cada resto terminal tiene un enlace terminal que se acopla directa o indirectamente a otros anclajes. Los anclajes acoplados comprenden el Xpandomero limitado que comprende ademas la hebra hija. Los anclajes tienen una “configuracion limitada” y una “configuracion expandida”. La configuracion limitada se encuentra en construcciones de sustrato y en la hebra hija. La configuracion limitada del anclaje es el precursor para la configuracion expandida, como se encuentra en productos de Xpandomero. La transicion de la configuracion limitada a la configuracion expandida produce la escision de enlaces selectivamente escindibles que pueden estar dentro del esqueleto primario de la hebra hija o enlaces intra-anclaje. Un anclaje en una configuracion limitada tambien se usa cuando un anclaje se anade para formar la hebra hija despues del ensamblaje del “esqueleto primario”. Los anclajes pueden opcionalmente comprender uno o mas indicadores o construcciones de indicador a lo largo de su longitud que pueden codificar informacion de secuencias de sustratos. El anclaje proporciona un medio para expandir la longitud del Xpandomero y asf reducir la densidad lineal de informacion de secuencias.
“Construcciones de anclaje” son anclajes o precursores de anclaje compuestos de uno o mas segmentos de anclaje u otros componentes arquitectonicos para ensamblar anclajes tales como construcciones de indicador, o precursores de indicador, que incluyen polfmeros, copolfmeros de injerto, copolfmeros de bloque, ligandos de afinidad, oligomeros, haptenos, aptameros, dendnmeros, grupos de enlace o grupo de union por afinidad (por ejemplo, biotina).
“Elemento de anclaje” o “segmento de anclaje” es un polfmero que tiene una dimension generalmente lineal con dos extremos terminales, en los que los extremos forman enlaces terminales para concatenar los elementos de anclaje. Los elementos de anclaje pueden ser segmentos de construcciones de anclaje. Tales polfmeros pueden incluir, pero no se limitan a: polietilenglicoles, poliglicoles, polipiridinas, poliisocianuros, poliisocianatos,
poli(triarilmetil)metacrilatos, polialdehfdos, polipirrolinonas, poliureas, fosfodiesteres de poliglicol, poliacrilatos, polimetacrilatos, poliacrilamidas, polivinilesteres, poliestirenos, poliamidas, poliuretanos, policarbonatos, polibutiratos, polibutadienos, polibutirolactonas, polipirrolidinonas, polivinilfosfonatos, poliacetamidas, polisacaridos, polihialuranatos, poliamidas, poliimidas, poliesteres, polietilenos, polipropilenos, poliestirenos, policarbonatos, politereftalatos, polisilanos, poliuretanos, polieteres, poliaminoacidos, poliglicinas, poliprolinas, polilisina N-sustituida, polipeptidos, peptidos sustituidos con N en la cadena lateral, poli-glicina N-sustituida, peptoides, peptidos sustituidos con carboxilo en la cadena lateral, homopeptidos, oligonucleotidos, oligonucleotidos de acido ribonucleico, oligonucleotidos de acido desoxinucleico, oligonucleotidos modificados para prevenir el apareamiento de bases de Watson-Crick, analogos de oligonucleotidos, acido policitidflico, acido poliademlico, acido poliuridflico, politimidina, polifosfato, polinucleotidos, polirribonucleotidos, fosfodiesteres de polietilenglicol, analogos de peptido-polinucleotido, analogos de treosil-polinucleotido, analogos de glicol-polinucleotido, analogos de morfolino-polinucleotido, analogos de oligomeros de nucleotidos bloqueados, analogos de polipeptidos, polfmeros ramificados, polfmeros en peine, polfmeros en estrella, polfmeros dendnticos, copolfmeros aleatorios, en gradiente y de bloque, polfmeros anionicos, polfmeros cationicos, polfmeros que forman tallo-bucles, segmentos ngidos y segmentos flexibles.
“Acido nucleico peptfdico” o “PNA” es un analogo de acido nucleico que tiene residuos de nucleobase adecuados para la hibridacion con un acido nucleico, pero con un esqueleto que comprende aminoacidos o derivados o analogos de los mismos.
“Acido nucleico fosfono-peptfdico” o “pPNA” es un acido nucleico peptfdico en el que el esqueleto comprende analogos de aminoacidos, tales como N-(2-hidroxietil)fosfonoglicina o N-(2-aminoetil)fosfonoglicina, y los enlaces entre unidades de nucleobases son mediante enlaces fosfonoester o fosfonoamida.
“Acido nucleico de serina” o “SerNA” es un acido nucleico peptfdico en el que el esqueleto comprende residuos de serina. Tales residuos pueden enlazarse mediante enlaces amida o ester.
“Acido nucleico de hidroxiprolina” o “HypNA” es un acido nucleico peptfdico en el que el esqueleto comprende residuos de 4-hidroxiprolina. Tales residuos pueden enlazarse mediante enlaces amida o ester.
“Elemento indicador” es un elemento de senalizacion, complejo molecular, compuesto, molecula o atomo que tambien comprende una “caractenstica de deteccion de indicador” asociada. Otros elementos indicadores incluyen, pero no se limitan a, donante o aceptor resonante de FRET, colorante, punto cuantico, perla, dendnmero, fluoroforo de conversion en exceso, partfcula de iman, dispersante de electrones (por ejemplo, boro), masa, perla de oro, resonancia magnetica, grupo ionizable, grupo polar, grupo hidrofobo. Todavfa otros son marcas fluorescentes, tales como, pero no se limitan a, bromuro de etidio, SYBR Green, Texas Red, naranja de acridina, pireno, 4-nitro-1,8- naftalimida, TOTO-1, YOYO-1, cianina 3 (Cy3), cianina 5 (Cy5), ficoeritrina, ficocianina, aloficocianina, FITC, rodamina, 5(6)-carboxifluorescema, protemas fluorescentes, DOXYL (N-oxil-4,4-dimetiloxazolidina), PROXYL (N-oxil- 2,2,5,5-tetrametilpirrolidina), TEMPO (N-oxil-2,2,6,6-tetrametilpiperidina), dinitrofenilo, acridinas, cumarinas, Cy3 y Cy5 (Biological Detection Systems, Inc.), eritrosina, acido cumarico, umbeliferona, Texas Red-rodamina, tetrametilo- rodamina, Rox, 7-nitrobenzo-1-oxa-1-diazol (NBD), oxazol, tiazol, pireno, fluorescema o lantamidas; tambien
5
10
15
20
25
30
35
40
45
50
55
33 3 14 35 125 32 131
radioisotopos (tales como P, H, C, S, I, P o I), etidio, europio, rutenio y samario u otros radioisotopos; o marcas de masa, tales como, por ejemplo, pirimidinas modificadas en la posicion C5 o purinas modificadas en la posicion N7, en las que los grupos modificadores de la masa pueden ser, por ejemplos, halogeno, eter o polieter, alquilo, ester o poliester, o del tipo general XR, en la que X es un grupo de enlace y R es un grupo modificador de la masa, marcas quimioluminiscentes, etiquetas de espm, enzimas (tales como peroxidasas, fosfatasas alcalinas, beta- galactosidasas y oxidasas), fragmentos de anticuerpos, y ligandos de afinidad (tales como un oligomero, hapteno y aptamero). La asociacion del elemento indicador con el anclaje puede ser covalente o no covalente, y directa o indirecta. Asociaciones covalentes representativas incluyen enlaces de conector y de conector cero. Se incluyen enlaces al esqueleto de anclaje o a un elemento unido al anclaje tal como un dendnmero o cadena lateral. Enlaces no covalentes representativos incluyen enlaces de hidrogeno, enlaces hidrofobos, enlaces ionicos, apilamiento de anillos de enlace pi, interacciones de Van der Waals y similares. Los ligandos, por ejemplo, estan asociados por union de afinidad espedfica con sitios de union sobre el elemento indicador. La asociacion directa puede tener lugar en el momento de la smtesis del anclaje, despues de la smtesis del anclaje, y antes o despues de la smtesis de Xpandomeros.
Un “indicador” esta compuesto por uno o mas elementos indicadores. Los indicadores incluyen lo que se conoce como “etiquetas” y “marcas”. La sonda o residuo de nucleobase del Xpandomero puede considerarse un indicador. Los indicadores sirven para analizar la informacion genetica del acido nucleico diana.
“Construccion de indicador” comprende uno o mas indicadores que pueden producir una senal(es) detectable(s), en la que la(s) senal(es) detectable(s) generalmente contienen informacion de secuencias. Esta informacion de senal se llama el “codigo de indicador” y posteriormente se descodifica en datos de secuencia genetica. Una construccion de indicador tambien puede comprender segmentos de anclaje u otros componentes arquitectonicos que incluyen polfmeros, copolfmeros de injerto, copolfmeros de bloque, ligandos de afinidad, oligomeros, haptenos, aptameros, dendnmeros, grupos de enlace o grupo de union por afinidad (por ejemplo, biotina).
“Caractenstica de deteccion de indicador” referida a la “senal” describe todos los posibles elementos, propiedades o caractensticas medibles o detectables usados para comunicar la informacion genetica de secuencias de un indicador directa o indirectamente a un dispositivo de medicion. Estos incluyen, pero no se limitan a, fluorescencia, fluorescencia de multi-longitud de onda, extincion de fluorescencia del espectro de emision, FRET, emision, absorbancia, reflectancia, emision de colorante, emision de puntos cuanticos, imagen de perlas, imagen de complejos moleculares, susceptibilidad magnetica, dispersion de electrones, masa ionica, resonancia magnetica, dimension del complejo molecular, impedancia del complejo molecular, carga molecular, dipolo inducido, impedancia, masa molecular, estado cuantico, capacidad de carga, estado de espm magnetico, polaridad inducible, decaimiento nuclear, resonancia o complementariedad.
“Codigo de indicador” es la informacion genetica de una senal medida de una construccion de indicador. El codigo de indicador se descodifica para proporcionar datos de informacion genetica espedfica de secuencia.
“Xsonda” es una construccion de sustrato oligomerico expansible. Cada Xsonda tiene un miembro de sonda y un miembro de anclaje. El miembro de anclaje generalmente tiene una o mas construcciones de indicador. Las Xsondas con modificaciones de 5'-monofosfato son compatibles con metodos basados en ligacion enzimatica para la smtesis de Xpandomeros. Las Xsondas con modificaciones de conector en 5' y 3' son compatibles con los metodos basados en ligacion qmmica para la smtesis de Xpandomeros.
“Xmero” es una construccion de sustrato oligomerico expansible. Cada Xmero tiene un miembro de sustrato oligomerico y un miembro de anclaje, teniendo el miembro de anclaje generalmente una o mas construcciones de indicador. Los Xmeros son 5'-trifosfatos compatibles con metodos basados en polimerasa para sintetizar Xpandomeros.
“RT-NTP” es una construccion de sustrato de nucleotido expansible modificada con 5' trifosfato (“sustrato monomerico”) compatible con la polimerizacion enzimatica dependiente del molde. Una RT-NTP tiene un desoxirribonucleotido trifosfato modificado (“DNTP”), ribonucleotido trifosfato (“RNTP”), o un sustrato de analogo funcionalmente equivalente, denominados conjuntamente el sustrato de nucleotido trifosfato (“NTPS”). Una RT-NTP tiene dos componentes funcionales distintos; concretamente, una nucleobase 5'-trifosfato y un anclaje o precursor de anclaje. Despues de la formacion de la hebra hija, el anclaje se une entre cada nucleotido en las posiciones que permiten la expansion de RT controlada. En una clase de RT-NTP (por ejemplo, la clase IX), el anclaje se une despues de la polimerizacion de RT-NTP. En algunos casos, la RT-NTP tiene un terminador de extremos reversibles y un anclaje que se reticula selectivamente directamente con anclajes adyacentes. Cada anclaje puede estar unicamente codificado con indicadores que identifican espedficamente el nucleotido al que esta anclado.
“XNTP” es un sustrato de nucleotido modificado con 5' trifosfato expansible compatible con polimerizacion enzimatica dependiente del molde. Un XNTP tiene dos componentes funcionales distintos; concretamente, una nucleobase 5'-trifosfato y un anclaje o precursor de anclaje que esta unido dentro de cada nucleotido en las posiciones que permiten la expansion de Re controlada por escision intra-nucleotido.
5
10
15
20
25
30
35
40
45
50
55
“Procesivo” se refiere a un proceso de acoplamiento de sustratos que es generalmente continuo y avanza con direccionalidad. Aunque no esta ligado por teona, tanto las ligasas como las polimerasas, por ejemplo, presentan comportamiento procesivo si los sustratos se anaden a una hebra hija naciente incrementalmente sin interrupcion. Las etapas de hibridacion y ligacion, o hibridacion y polimerizacion, no se consideran etapas independientes si el efecto neto es el crecimiento procesivo de la hebra hija naciente. Algunos, pero no todos los procesos dependientes de cebador, son procesivos.
“Promiscuo” se refiere a un proceso de acoplamiento de sustratos que avanza a partir de multiples puntos sobre un molde de una vez, y no es dependiente de cebador, e indica que la expansion de cadena se produce en paralelo (simultaneamente) a partir de mas de un punto de origen.
“Extension de una unica base” se refiere a un proceso de escalonado dclico en el que los sustratos monomericos se anaden uno por uno. Generalmente, la reaccion de acoplamiento se limita de avanzar mas alla de una extension de un unico sustrato en una etapa cualquiera por el uso de grupos de bloqueo reversibles.
“Extension de una unica sonda” se refiere a un proceso de escalonado dclico en el que sustratos oligomericos se anaden uno por uno. Generalmente, la reaccion de acoplamiento se limita de avanzar mas alla de una extension de un unico sustrato en una etapa cualquiera por el uso de grupos de bloqueo reversibles.
“Se corresponde con” o “correspondiente” se usa aqu en referencia a una secuencia monocatenaria contigua de una sonda, oligonucleotido, analogo de oligonucleotido, o hebra hija que es complementaria, y asf “se corresponde con” toda o una porcion de una secuencia de acidos nucleicos diana. La secuencia complementaria de una sonda puede decirse que se corresponde con su diana. A menos que se establezca de otro modo, tanto la secuencia complementaria de la sonda como la secuencia complementaria de la diana son secuencias individualmente contiguas.
“Resistente a nucleasa” se refiere a es un enlace que es resistente a una enzima nucleasa en condiciones en las que un enlace fosfodiester de ADN o ARN generalmente se escindira. Las enzimas nucleasas incluyen, pero no se limitan a, DNasa I, exonucleasa III, nucleasa de judfa mungo, RNasa I y RNasa H. Un experto en este campo puede evaluar facilmente la resistencia a nucleasas relativa de un enlace dado.
“Ligasa” es una enzima generalmente para unir nucleotidos 3'-OH 5'-monofosfato, oligomeros, y sus analogos. Las ligasas incluyen, pero no se limitan a, ligasas dependientes de NAD+ que incluyen ARNt ligasa, ADN ligasa Taq, ADN ligasa de Thermus filiformis, ADN ligasa de Escherichia coli, ADN ligasa Tth, ADN ligasa de Thermus scotoductus, ligasa termoestable, ADN ligasa termoestable Ampligase, ligasa tipo VanC, ADN ligasa 9°N, ADN ligasa Tsp, y ligasas novedosas descubiertas por bioprospeccion. Las ligasas tambien incluyen, pero no se limitan a, ligasas dependientes de ATP que incluyen ARN ligasa T4, ADN ligasa T4, ADN ligasa T7, ADN ligasa Pfu, ADN ligasa I, aDn ligasa III, ADN ligasa IV, y ligasas novedosas descubiertas por bioprospeccion. Estas ligasas incluyen isoformas no mutantes, mutantes y variantes geneticamente manipuladas.
“Polimerasa” es una enzima generalmente para unir nucleotidos de 3'-OH 5'-trifosfato, oligomeros, y sus analogos. Las polimerasas incluyen, pero no se limitan a, ADN polimerasas dependientes de ADN, aRn polimerasas dependientes de ADN, ADN polimerasas dependientes de ARN, ADN polimerasas dependientes de ARN, ADN polimerasa T7, ADN polimerasa T3, ADN polimerasa T4, ARN polimerasa T7, ARN polimerasa T3, ARN polimerasa SP6, ADN polimerasa I fragmento de Klenow, ADN polimerasa de Thermophilus aquaticus, ADN polimerasa Tth, ADN polimerasa VentR® (New England Biolabs), ADN polimerasa Deep VentR® (New England Biolabs), fragmento grande de ADN polimerasa Bst, fragmento de Stoeffel, ADN polimerasa 9°N, ADN polimerasa 9°N, ADN polimerasa Pfu, ADN polimerasa Tfl, ADN polimerasa Tth, polimerasa RepliPHI Phi29, ADN polimerasa Tli, ADN polimerasa beta de eucariota, telomerasa, polimerasa Therminator™ (New England Biolabs), ADN polimerasa KOD HiFi™ (Novagen), ADN polimerasa KODl, Q-beta replicasa, transferasa terminal, transcriptasa inversa AMV, transcriptasa inversa M-MLV, transcriptasa inversa Phi6, transcriptasa inversa del VIH-1, polimerasas novedosas descubiertas por bioprospeccion, y polimerasas citadas en los documentos US 2007/0048748, US 6.329.178, US 6.602.695 y US 6.395.524. Estas polimerasas incluyen isoformas no mutantes, mutantes, y variantes geneticamente manipuladas.
“Codificar” o “analizar” son verbos con referencia a transferir de un formato a otro, y se refiere a transferir la informacion genetica de la secuencia base del molde diana en una disposicion de indicadores.
“Extragenetico” se refiere a cualquier estructura en la hebra hija que no es parte del esqueleto primario; por ejemplo, un informador extragenetico no es la propia nucleobase que se encuentra en el esqueleto primario.
“Hetero-copolfmero” es un material formado combinando unidades diferentes (por ejemplo, especies de subunidad de monomero) en cadenas de un “copolfmero”. Los hetero-copolfmeros se forman a partir de construcciones de “subunidad” discretas. Una “subunidad” es una region de un polfmero compuesta por un motivo bien definido, en la que cada motivo es una especie y lleva informacion genetica. El termino hetero-copolfmero tambien se usa en el presente documento para describir un polfmero en el que todos los bloques son bloques construidos de motivos de repeticion, teniendo cada motivo elementos espedficos de especie. La hebra hija y el Xpandomero son ambos hetero-copolfmeros, por lo que cada motivo de subunidad codifica 1 o mas bases de la secuencia del molde diana y la secuencia diana entera se define adicionalmente con la secuencia de motivos.
5
10
15
20
25
30
35
40
45
50
55
60
“Soporte solido” es un material solido que tiene una superficie para la union de moleculas, compuestos, celulas, u otras entidades. La superficie de un soporte solido puede ser plana o no plana. Un soporte solido puede ser poroso o no poroso. Un soporte solido puede ser un chip o matriz que comprende una superficie, y que puede comprender vidrio, silicio, nailon, polfmeros, plasticos, ceramicas, o metales. Un soporte solido tambien puede ser una membrana, tal como una membrana de nailon, nitrocelulosa, o polimerica, o una placa o disco, y comprender vidrio, ceramica, metales, o plasticos, tales como, por ejemplo, poliestireno, polipropileno, policarbonato o polialomero. Un soporte solido tambien puede ser una perla, resina o partfcula de cualquier forma. Tales partfculas o perlas pueden comprender cualquier material adecuado, tal como vidrio o ceramica, y/o uno o mas polfmeros, tales como, por ejemplo, nailon, politetrafluoroetileno, TEFLON™, poliestireno, poliacrilamida, Sepaharose, agarosa, celulosa, derivados de celulosa, o dextrano, y/o pueden comprender metales, particularmente metales paramagneticos, tales como hierro.
“Bloquear reversiblemente” o “terminador” se refiere a un grupo qrnmico que cuando se une a un segundo grupo qrnmico en un resto previene que el segundo grupo qrnmico entre en reacciones qmmicas particulares. Se conoce un amplio intervalo de grupos protectores en la qrnmica organica y bioorganica sintetica que son adecuados para grupos qrnmicos particulares y son compatibles con procesos qrnmicos particulares, que significa que protegeran a grupos particulares durante aquellos procesos y pueden ser posteriormente eliminados o modificados (vease, por ejemplo, Metzker et al. Nucleic Acids Res., 22(20): 4259, 1994).
“Conector” es una molecula o resto que une dos moleculas o restos, y proporciona separacion entre las dos moleculas o restos de forma que sean capaces de funcionar en su forma prevista. Por ejemplo, un conector puede comprender una cadena de hidrocarburo de diamina que se une covalentemente mediante un grupo reactivo sobre un extremo a una molecula de analogo de oligonucleotido y mediante un grupo reactivo sobre otro extremo a un soporte solido, tal como, por ejemplo, una superficie de perla. El acoplamiento de conectores a nucleotidos y construcciones de sustrato de interes puede llevarse a cabo mediante el uso de reactivos de acoplamiento que se conocen en la tecnica (vease, por ejemplo, Efimov et al., Nucleic Acids Res. 27: 4416-4426, 1999). Los metodos de derivatizacion y acoplamiento de moleculas organicas son muy conocidos en las tecnicas de la qrnmica organica e bioorganica. Un conector tambien puede ser escindible o reversible.
Vision general
En terminos generales, se describen metodos y dispositivos y productos correspondientes para replicar acidos nucleicos diana de una unica molecula. Tales metodos utilizan “Xpandomeros” que permiten la secuenciacion del acido nucleico diana con elevado rendimiento y exactitud. Un Xpandomero codifica (analiza) los datos de la secuencia de nucleotidos del acido nucleico diana en un formato linealmente expandido, mejorandose asf la resolucion espacial, opcionalmente con amplificacion de la intensidad de senales. Estos procesos se denominan en el presente documento “secuenciacion por expansion” o “SBX”.
Como se muestra en la Figura 1A, los acidos nucleicos de duplex nativo tienen una densidad de datos lineal extremadamente compacta; aproximadamente una separacion de centro a centro de 3,4 A entre bases apiladas secuenciales (2) de cada hebra de la helice doble (1), y, por tanto, es tremendamente diffcil obtener directamente imagenes o secuencia con cualquier exactitud y velocidad. Cuando la forma bicatenaria se desnaturaliza para formar polinucleotidos monocatenarios (3,4), las distancias de separacion base a base resultantes son similares, pero el problema se agrava por dominios de la estructura secundaria.
Como se muestra en la Figura 1B, el Xpandomero (5), aqrn ilustrado como una concatenacion de oligomeros cortos (6,7) mantenidos juntos por anclajes T extrageneticos (8,9), es una sustitucion sintetica o “suplente” para la diana de acido nucleico que va a secuenciarse. Las bases complementarias al molde se incorporan en el Xpandomero, pero los anclajes regularmente separados sirven para aumentar la distancia entre los oligomeros cortos (aqrn cada uno mostrado con cuatro nucleobases representadas por drculos). El Xpandomero se prepara por un proceso en el que un producto intermedio de duplex sintetico se forma primero replicando una hebra molde. La hebra hija es unica porque tiene tanto un esqueleto lineal formado por los oligomeros como un esqueleto de Xpandomero limitado comprendido de anclajes plegados. Los anclajes se abren entonces o se “expanden” para transformar el producto en una cadena de anclajes alargados. Figurativamente, la hebra hija puede visualizarse como que tiene dos esqueletos superpuestos: uno lineal (esqueleto primario) y el otro con pliegues de “acordeon” (Xpandomero limitado). La escision selectiva de enlaces en la hebra hija permite que los pliegues de acordeon se expandan para producir un producto de Xpandomero. Este proceso se explicara mas abajo en mas detalle, pero debe observarse que la eleccion de cuatro nucleobases por oligomero y datos del anclaje como se muestra en la Figura 1B es con el fin de ilustracion solo, y de ninguna forma debe interpretarse para limitar la invencion.
La distancia de separacion “D” entre oligomeros vecinos en el Xpandomero es ahora una variante dependiente del proceso y se determina por la longitud del anclaje T. Como se mostrara, la longitud del anclaje T se disena en las construcciones de sustrato, los elementos estructurales a partir de los cuales se prepara el Xpandomero. La distancia de separacion D puede seleccionarse para ser, por ejemplo, superior a 0,5 nm, o superior a 2 nm, o superior a 5 nm, o superior a 10 nm, o superior a 50 nm. A medida que aumenta la distancia de separacion, el proceso de discriminacion o “resolucion” de los oligomeros individuales se vuelve progresivamente cada vez mas facil. Esto tambien sena cierto si, en lugar de oligomeros, nucleobases individuales de otra especie de Xpandomero
5
10
15
20
25
30
35
40
45
50
55
60
se ensartaran juntas sobre una cadena de anclajes.
Refiriendose de nuevo a la Figura 1A, el ADN nativo se replica por un proceso de replicacion semi-conservativa; cada nueva molecula de ADN es un “duplex” de una hebra molde (3) y una hebra hija nativa (4). La informacion de secuencias se pasa del molde a la hebra hija nativa por un proceso de “smtesis dirigida por molde” que preserva la informacion genetica inherente en la secuencia de los pares de bases. La hebra hija nativa recibe a su vez un molde para una hebra hija nativa de la siguiente generacion, etc. Los Xpandomeros se forman por un proceso de smtesis dirigida por molde similar, que puede ser un proceso enzimatico o de acoplamiento qmmico. Sin embargo, a diferencia del ADN nativo, una vez formados, los Xpandomeros no pueden replicarse por un proceso biologico de replicacion semi-conservativa y no son adecuados para la amplificacion por procesos tales como PCR. El producto de Xpandomero se disena para limitar la estructura secundaria no deseada.
Las Figuras 2A a 2D muestran sustratos de Xpandomero de clase I (20,21,22,23) representativos. Estos son los elementos estructurales a partir de los cuales se sintetizan los Xpandomeros. Otros sustratos de Xpandomero (diez clases se desvelan en el presente documento) se tratan en las secciones posteriores. Las construcciones de sustrato de Xpandomero mostradas aqrn tienen dos componentes funcionales; concretamente, un miembro de sonda (10) y un miembro de “anclaje” (11) en una configuracion de bucle. El bucle forma el anclaje “T” alargado del producto final. Unicamente por comodidad en la explicacion, el miembro de sonda se representa de nuevo con cuatro residuos de nucleobase (14,15,16,17) como se muestra en la Figura 2B.
Estas construcciones de sustrato pueden estar modificadas en los extremos con grupos R, por ejemplo, como un 5'- monofosfato, 3'-OH adecuado para su uso con una ligasa (denominado en el presente documento “Xsonda”) o como un 5'-trifosfato, 3'-OH adecuado para su uso con una polimerasa (denominado en el presente documento un “Xmero”). Otros grupos R pueden ser de uso en diversos protocolos. En el primer ejemplo mostrado en la Figura 3B, los presentes inventores presentan el uso de Xsondas en la smtesis de un Xpandomero a partir de una hebra molde de un acido nucleico diana por un proceso dependiente de ligasa.
Los cuatro residuos de nucleobase (14,15,16,17) del miembro de sonda (10) estan seleccionados para ser complementarios a una secuencia contigua de cuatro nucleotidos del molde. Cada “sonda” esta asf disenada para hibridarse con el molde en una secuencia complementaria de cuatro nucleotidos. Suministrando una biblioteca de muchas de tales secuencias de sonda puede formarse una replica complementaria contigua del molde. Esta hebra hija se llama un “producto intermedio de Xpandomero”. Los productos intermedios de Xpandomero tienen formas de duplex o monocatenarias.
El bucle de anclaje esta unido al miembro de sonda (10) en el segundo y tercer residuos de nucleobase (15,16). El segundo y tercer residuos de nucleobase (15,16) tambien estan unidos entre sf por un “enlace selectivamente escindible” (25) representado por una “V”. La escision de este enlace escindible permite que el bucle de anclaje se expanda. Puede decirse que el anclaje linealizado “conecta” el sitio de enlace selectivamente escindible del esqueleto de polinucleotido primario de una hebra hija. La escision de estos enlaces rompe el esqueleto primario y forma el Xpandomero mas largo.
La escision selectiva de los enlaces selectivamente escindibles (25) puede hacerse en una variedad de formas que incluyen, pero no se limitan a, escision qrnmica de enlaces fosforotiolato, digestion por ribonucleasa de enlaces ribosil 5'-3' fosfodiester, escision de enlaces fotoescindibles, y similares, como se trata en mayor detalle mas adelante.
La construccion de sustrato (20) mostrada en la Figura 2A tiene un unico segmento de anclaje, representado aqrn por una elipse (26), para la union de elementos indicadores. Este segmento esta flanqueado con segmentos de anclaje espaciadores (12,13), todos los cuales forman conjuntamente la construccion de anclaje. A este respecto pueden usarse de uno a muchos dendnmero(s), polfmero(s), polfmero(s) ramificado(s) o combinaciones, por ejemplo, para construir el segmento de anclaje. Para la construccion de sustrato (21) de la Figura 2B, la construccion de anclaje esta compuesta por tres segmentos de anclaje para la union de elementos indicadores (27,28,29), cada uno de los cuales esta flanqueado con un segmento de anclaje espaciador. La combinacion de elementos indicadores forma conjuntamente una “construccion de indicador” para producir un codigo de indicador digital unico (para la identificacion de secuencias de sonda). Estos elementos indicadores incluyen, pero no se limitan a, fluoroforos, marcas de FRET, perlas, ligandos, aptameros, peptidos, haptenos, oligomeros, polinucleotidos, dendnmeros, estructuras de tallo-bucle, marcas de afinidad, marcas de masa y similares. El bucle de anclaje (11) de la construccion de sustrato (22) en la Figura 2C esta “desnudo”. La informacion genetica codificada en esta construccion no esta codificada sobre el anclaje, pero esta asociada a la sonda (10), por ejemplo, en forma de nucleotidos marcados. La construccion de sustrato (23) de la Figura 2D ilustra el principio general: como se indica por el asterisco (*), la informacion de secuencias de la sonda esta codificada o “se analiza” en la construccion de sustrato de una forma modificada mas facilmente detectada en un protocolo de secuenciacion. Debido a que los datos de secuencia se resuelven ffsicamente mejor despues de la escision del enlace selectivamente escindible (25) para formar el polfmero de Xpandomero linealmente alargado, el asterisco (*) representa cualquier forma de informacion genetica codificada para la que esto es un beneficio. El elemento o elementos bioinformaticos (*) de la construccion de sustrato, sea cual sea su forma, pueden ser detectables directamente o pueden ser precursores a los que los elementos detectables se anaden en una etapa de marcado post-ensamblaje. En algunos casos, la
5
10
15
20
25
30
35
40
45
50
55
60
informacion genetica esta codificada en una propiedad molecular de la propia construccion de sustrato, por ejemplo, una marca de masa de multi-estado. En otros casos, la informacion genetica esta codificada por uno o mas fluoroforos de los pares de donante:aceptor de FRET, o un codigo de barras nanomolecular, o un ligando o combinacion de ligandos, o en forma de alguna otra tecnica de marcado extrafda de la materia. Se trataran diversas realizaciones mas abajo en mas detalle.
El anclaje generalmente cumple varias funciones: (1) enlazarse secuencialmente, directa o indirectamente, a anclajes adyacentes que forman el producto intermedio de Xpandomero; (2) estirarse y expandirse para formar una cadena alargada de anclajes tras la escision de enlaces seleccionados en el esqueleto primario o dentro del anclaje (vease la Figura 1 B); y/o (3) proporcionar una construccion molecular para incorporar elementos indicadores, tambien llamados “etiquetas” o “marcas”, que codifican la informacion de secuencias del residuo de nucleobase de su sustrato asociado. El anclaje puede disenarse para optimizar la funcion codificante ajustando separaciones espaciales, abundancia, densidad informacional e intensidad de senales de sus elementos indicadores constituyentes. Un amplio intervalo de propiedades indicadoras es util para amplificar la intensidad de senales de la informacion genetica codificada dentro de la construccion de sustrato. La bibliograffa dirigida a indicadores, codigos de barras moleculares, union por afinidad, macado molecular y otros elementos indicadores, es muy conocida para un experto en este campo.
Puede observarse que si cada sustrato de una construccion de sustrato contiene x nucleobases, entonces una biblioteca que representa todas las posibles combinaciones secuenciales de x nucleobases contendna 4x sondas (cuando se seleccionan las nucleobases de A, T, C o G). Si se usan otras bases puede necesitarse menos o mas combinaciones. Estas bibliotecas de sustrato se disenan de manera que cada construccion de sustrato contenga (1) una sonda (o al menos un residuo de nucleobase) complementaria a una cualquiera de las posibles secuencias diana del acido nucleico que va a secuenciarse y (2) una construccion de indicador unica que codifica la identidad de la secuencia diana a la que esa sonda (o nucleobase) particular es complementaria. Una biblioteca de sondas que contienen dos nucleobases tendna 16 miembros unicos; una biblioteca de sondas que contiene tres nucleobases tendna 64 miembros unicos, etc. Una biblioteca representativa tendna las cuatro nucleobases individuales, pero configuradas para acomodar un medio de anclaje.
La smtesis de un Xpandomero se ilustra en las Figuras 3A a 3C. El sustrato representado aqrn es una Xsonda y el metodo puede describirse como la hibridacion con ligacion procesiva dependiente de cebador en disolucion libre.
Pueden adaptarse muchos protocolos de biologfa molecular muy conocidos, tales como los protocolos para fragmentar el ADN diana y ligar adaptadores de extremo, para su uso en metodos de secuenciacion y se usan aqrn para preparar el ADN diana (30) para la secuenciacion. Aqrn, los presentes inventores ilustran, en amplios terminos, lo que sena familiar para aquellos expertos en la materia, procesos para pulir los extremos de los fragmentos y ligacion de extremos romos de adaptadores (31,32) disenados para su uso con cebadores de secuenciacion. Estas acciones se muestran en la etapa I de la Figura 3A. En las etapas II y III, el acido nucleico diana se desnaturaliza y se hibrida con cebadores (33) adecuados complementarios a los adaptadores.
En la Figura 3B, la hebra molde cebada de la etapa III se pone en contacto con una biblioteca de construcciones de sustrato (36) y ligasa (L), y en la etapa IV las condiciones se ajustan para favorecer la hibridacion, seguido de ligacion en un 3'-OH libre de un duplex de cebador-molde. Opcionalmente, en la etapa V, la ligasa se disocia, y en las etapas VI y VII puede reconocerse que el proceso de hibridacion y ligacion produce la extension por adicion acumulada de sustratos (37,38) al extremo del cebador. Aunque el cebado puede producirse a partir de adaptadores en ambos extremos de un molde monocatenario, el crecimiento de una hebra hija de Xpandomero naciente se muestra aqrn que avanza a partir de un unico cebador, unicamente para simplicidad. La extension de la hebra hija se representa en las etapas VI y VII, que se repiten continuamente (incrementalmente, sin interrupcion). Estas reacciones se producen en disolucion libre y avanzan hasta que se haya sintetizado una cantidad suficiente de producto. En la etapa VIII se muestra la formacion de un producto intermedio de Xpandomero (39) completado.
Longitudes relativamente largas de la secuencia de nucleotidos contigua pueden replicarse eficazmente de este modo para formar productos intermedios de Xpandomeros. Puede observarse que las longitudes de lectura continuas (“contigos”) correspondientes a fragmentos de hebra molde largos pueden lograrse con esta tecnologfa. Sera evidente para un experto en la materia que billones de estas reacciones de SBX de una unica molecula pueden hacerse simultaneamente en un proceso discontinuo eficaz en un unico tubo. Posteriormente, pueden secuenciarse los productos de secuenciacion aleatoria de estas smtesis.
En la Figura 3C se representan las siguientes etapas del proceso de SBX. La etapa IX muestra la desnaturalizacion del producto intermedio de Xpandomero de duplex, seguido de la escision de enlaces selectivamente escindibles en el esqueleto, con los enlaces selectivamente escindibles disenados de manera que los bucles de anclaje “se abran”, formando el producto de Xpandomero linealmente alargado (34). Tal escision selectiva puede lograrse por cualquier numero de tecnicas conocidas para un experto en la materia, que incluyen, pero no se limitan a, escision de fosforotiolato con cationes metalicos como se desvela por Mag et al. (“Synthesis and selective cleavage of an oligodeoxynucleotide containing a bridged internucleotide 5'-phosphorothioate linkage”, Nucleic Acids Research 19(7):1437-1441, 1991), escision catalizada por acido de fosforamidato como se desvela por Mag et al. (“Synthesis and selective cleavage of oligodeoxyribonucleotides containing non-chiral internucleotide phosphoramidate linkages”,
5
10
15
20
25
30
35
40
45
50
55
60
Nucleic Acids Research 17(15): 5973-5988, 1989), escision por nucleasa selectiva de enlaces fosfodiester como se desvela por Gut et al. (“A novel procedure for efficient genotyping of single nucleotide polymorphisms”, Nucleic Acids Research 28(5): E13, 2000) y por separado por Eckstein et al. (“Inhibition of restriction endonuclease hydrolysis by phosphorothioate-containing DNA”, Nucleic Acids Research, 25;17(22): 9495, 1989) y escision selectiva del esqueleto de fosfodiester modificado por conector fotoescindible como se desvela por Sauer et al. (“MALDI mass spectrometry analysis of single nucleotide polymorphisms by photocleavage and charge-tagging”, Nucleic Acids Research 31,11 e63, 2003), Vallone et al. (“Genotyping SNPs using a UV-photocleavable oligonucleotide in MALDI- TOF MS”, Methods Mol. Bio. 297:169-78, 2005) y Ordoukhanian et al. (“Design and synthesis of a versatile photocleavable DNA building block, application to phototriggered hybridization”, J. Am. Chem. Soc. 117, 9570-9571, 1995).
Los refinamientos del proceso basico, tales como las etapas de lavado y ajuste de las condiciones de rigurosidad, estan perfectamente dentro de la experiencia de un biologo molecular experimentado. Variantes a este proceso incluyen, por ejemplo, inmovilizacion y analisis de las hebras diana, estiramiento y otras tecnicas para reducir la estructura secundaria durante la smtesis del Xpandomero, marcado post-expansion, funcionalizacion de extremos y alternativas a la ligasa para enlazar los sustratos se trataran en los materiales que siguen.
La smtesis de Xpandomeros se hace para facilitar la deteccion y secuenciacion de acidos nucleicos, y es aplicable a acidos nucleicos de todos los tipos. El proceso es un metodo de “expansion” o “alargamiento” de la longitud de elementos del esqueleto (o subunidades) que codifican la informacion de secuencias (expandida con respecto a las pequenas distancias nucleotido a nucleotido de acidos nucleicos nativos) y opcionalmente tambien sirve para aumentar la intensidad de senales (con respecto a las senales de baja intensidad casi indistinguibles observadas para los nucleotidos nativos). Como tales, los elementos indicadores incorporados en el esqueleto sintetico expandido de un Xpandomero pueden detectarse y procesarse usando una variedad de metodos de deteccion, que incluyen metodos de deteccion muy conocidos en la tecnica (por ejemplo, una camara de CCD, un microscopio de fuerza atomica, o un espectrometro de masas regulado), ademas de por metodos tales como una matriz de sensor de nanoporos masivamente paralela, o una combinacion de metodos. Las tecnicas de deteccion se seleccionan basandose en la senal optima con respecto al ruido, rendimiento, coste y factores similares.
Volviendo a la Figura 4, se muestra un simple modelo de una tecnologfa de deteccion; concretamente, un nanoporo (40) con donante de FRET (42) en una membrana (44), que se excita por luz de longitud de onda X-i. Como el producto de Xpandomero (41) se alarga y es transportado a traves del nanoporo (40) en la direccion de la flecha (45), se detectan explosiones en serie de emision de longitud de onda X2 de fluoroforos excitados, en la proximidad del poro. Las longitudes de onda de emision (X2) se separan temporalmente en funcion de la longitud del anclaje y la velocidad del Xpandomero que pasa a traves del nanoporo. Capturando estas senales analogas y procesandolas digitalmente, la informacion de secuencias puede leerse directamente a partir del Xpandomero. Debe observarse que en este metodo de deteccion, el nanoporo y la membrana pueden tener muchas trayectorias a traves de las cuales el Xpandomero puede translocarse. La deteccion de FRET requiere que haya al menos un donante de FRET excitado a lo largo de cada trayectoria. A diferencia, un nanoporo basado en contador de Coulter puede solo tener orificio de translocalizacion adicional a costa de la senal con respecto al ruido.
En la tecnica de deteccion basada en nanoporos de la Figura 4, que representa cadenas de Xsondas de la estructura mostrada en la Figura 2B, las construcciones de anclaje contienen construcciones de indicador multi- elemento, como se indica por los miembros de indicador tipo caja (27,28,29) dispuestos a lo largo del anclaje. Se
desvela tecnologfa de secuenciacion de nanoporos relevante, por ejemplo, por Branton et al. en la patente de
EE.UU. N°. 6.627.067 y por Lee et al. (Lee, JW y A Meller. 2007. Rapid sequencing by direct nanoscale reading of nucleotide bases in individual DNA chains. En “New High Throughput Technologies for DNA Sequencing and Genomics, 2”, Elsevier).
La Figura 5 demuestra como las construcciones de indicador multi-elemento, que aqrn comprenden fluoroforos aceptores de FRET, aparecen a un detector posicionado en la puerta de FRET. Puede observarse en esta representacion multi-canal de emisiones que senales analogas se generan a intervalos generalmente regulares de tiempo y pueden analizarse como un tipo de codigo digital (aqrn llamado un codigo de indicador y, para este ejemplo, una ID de Xsonda) que revela la identidad y orden de las subunidades de Xsonda y asf la secuencia genetica del Xpandomero ilustrado. Pueden usarse diversas combinaciones de indicadores para crear una biblioteca de codigos de indicador que codifican secuencialmente cualquier combinacion de 4 bases de A, T, G o C de la Xsonda descrita. En este ejemplo, se usan combinaciones de tres fluoroforos para producir veintidos codigos de
indicador. De esta forma, se observa que la secuencia ACTG va seguida de GCCG; seguido de AAAT. Lmeas de
puntos verticalmente dispuestas separan los datos de fluorimetna y las subunidades correspondientes del Xpandomero (mostrado esquematicamente). Un algoritmo interpretativo inmediatamente debajo de la representacion muestra como las senales analogas regularmente separadas se transforman en una secuencia genetica legible.
La construccion de sustrato de Xsonda ilustrada en la Figura 5, que usa una construccion de anclaje multi-elemento compuesta de tres segmentos marcados con indicador, cada uno de los cuales esta flanqueado con segmentos de anclaje espaciadores, para codificar la identidad de secuencias del sustrato, se elabora adicionalmente. El primer segmento de anclaje es el codigo de indicador N° 1 (lectura de izquierda a derecha), y se lee como una senal alta en el canal rojo. El segundo segmento de anclaje es el codigo de indicador N° 9, y se lee como una senal verde alta y
5
10
15
20
25
30
35
40
45
50
55
60
una senal roja baja. El tercer segmento de anclaje es el codigo de indicador N° 8, y se lee como una senal azul baja y una senal roja baja. El codigo de indicador N° 1 se usa como un reloj o senal de sincronizacion; el codigo de indicador N° 9 codifica el primer resto de sonda “AC”; el codigo de indicador numero N° 8 codifica el segundo resto “TG” de la sonda. Tornados conjuntamente, el codigo de indicador secuencial de “1-9-8” se corresponde con una especie particular de la Xsonda (Xsonda ID 117), que a su vez se corresponde por diseno con el fragmento de secuencia “ACTG”. Tres ID de Xsonda codifican la secuencia contigua entera mostrada en la representacion, “ACTGGCCGAAAT”. Las emisiones de fluoroforo, la tabla para descodificar codigos de indicador y los fragmentos de secuencia, y las representaciones ffsicas correspondientes de las construcciones de indicador, estan separadas por las lmeas de puntos de las figuras segun subunidades estructurales del Xpandomero de manera que pueda facilmente observarse como la informacion de secuencias se descodifica y digitaliza.
La Figura 6 es una tabla de marcas de fluoroforo a partir de las cuales se preparo el ejemplo de la Figura 5. Esto ilustra mas generalmente el uso de combinaciones de codigos de indicador multi-estado para analizar la informacion en forma de senales detectables. Se usan fluoroforos que tienen veintidos posibles estados de emision para formar las construcciones de indicador de este ejemplo. Tres marcas de fluoroforo por oligomero son mas que adecuadas para codificar todas las posibles combinaciones 4meras de A, T, C y G. Aumentando la longitud del anclaje, mejora la resolucion entre las emisiones de marcas de fluoroforo, beneficiandose la exactitud de la etapa de deteccion, un principio que es generalmente aplicable.
Indicadores utiles con construcciones de anclaje de este tipo son de muchos tipos, no simplemente fluoroforos, y pueden medirse usando un ancho intervalo correspondiente de tecnologfas de alto rendimiento y deteccion precisa, tecnologfas que podnan no ser de otro modo utiles para secuenciar acidos nucleicos nativos debido a resolucion limitada. Los metodos de deteccion del estado de la tecnica masivamente paralelos, tales como matrices de sensores de nanoporos, se facilitan por las caractensticas mas medibles de Xpandomeros. Las ineficiencias en los procesos de deteccion de la secuenciacion pueden reducirse pre-purificando lotes de Xpandomeros para eliminar productos de reaccion incompletos o cortos. Se proporcionan metodos para la modificacion de extremos de Xpandomeros sintetizados que puede utilizarse para tanto la purificacion como bien como medio para facilitar la presentacion de Xpandomeros al detector. Ademas, el proceso de lectura no esta limitado por la limitacion al encapuchado, desencapuchado, extension de nucleotidos, marcado, u otros metodos de procesamiento simultaneos.
La Figura 7A describe un molde de duplex parcial disenado con un nucleotido protuberante en 5' de veinte bases para demostrar la ligacion procesiva de sustratos y la ligacion dirigida por molde iniciada por cebador en disolucion libre. La Figura 7B es una fotograffa de un gel que demuestra la ligacion de los sustratos usando el formato de cebador-molde descrito en la Figura 7A. Para este ejemplo, los sustratos oligomericos de dinucleotido de la secuencia 5' fosfato CA 3' se hibridan con el molde en presencia de un cebador y ADN ligasa T4. El nucleotido protuberante del extremo sin duplexar (si lo hay) se digiere entonces con nucleasa y los productos de ligacion se separan sobre un gel de 20 % de acrilamida. La ligacion produce polfmeros producto que contienen subunidades demostrablemente ligadas. Como se indica por el patron de bandeo, las reacciones positivas para ligasa que corren en los carriles 1, 3, 5, 7 y 9, que contienen moldes progresivamente mas largos (4, 8, 12, 16 y 20 bases, respectivamente), demuestran claramente la ligacion secuencial de sustratos 2meros (elevadas longitudes de duplex protegidos con exonucleasa). Los carriles 2, 4, 6, 8 y 10 son controles negativos que no contienen ligasa y muestran digestion con exonucleasa completa de productos sin ligar.
La Figura 7C es un segundo gel que muestra ligacion dirigida por molde de sustratos. Se ensayaron cuatro moldes de control positivo progresivamente mas largos, de nuevo duplexados con un cebador de extension (4, 8, 12 y 16 bases de molde, respectivamente). De nuevo, los sustratos oligomericos de dinucleotido de la secuencia 5' fosfato CA 3' se hibridan con el molde en presencia de un cebador y ADN ligasa T4. El nucleotido protuberante del extremo sin duplexar (si lo hay) se digiere entonces con nucleasa y los productos de ligacion se separan sobre un gel de 20 % de acrilamida. Se observa que los sustratos oligomericos (de nuevo 2meros) se ligan al molde en los carriles 1, 2, 3 y 4, pero no en los carriles 5 y 6, en los que las hebras molde contienen un desapareamiento con el dinucleotido 5' (fosfato) CA 3' (molde del carril 5-5' CGcG 3'; molde del carril 6 - 5' GGGG 3').
Los resultados del gel mostrados en la Figura 7D demuestran multiples ligaciones dirigidas por molde de una sonda de tetranucleotido modificada con bis(amino). Las modificadores de amino alifaticas fueron del enlace y composicion descritos en la Figura 26. Para este ejemplo, un sustrato oligomerico de tetranucleotido de la secuencia 5' (fosfato) C (amino)A (amino)C A 3' se hibrido con una variedad de moldes complementarios progresivamente mas largos (duplexados con un cebador de extension) en presencia de un cebador y ADN ligasa T4. El nucleotido protuberante del extremo si duplexar (si lo hay) fue entonces digerido por nucleasa y los productos de ligacion se separaron sobre un gel de acrilamida al 20 %. La ligacion produce polfmeros producto que contienen subunidades demostrablemente ligadas. Los carriles 1 y 2 representan controles de tamano 16mero y 20mero. Los carriles 3, 4, 5, 6, 7, 8 y 9 muestran productos de ligacion para moldes complementarios progresivamente mas largos (4, 6, 8, 12, 16, 18 y 20 bases de molde, respectivamente). Se observan multiples ligaciones de tetramero para reacciones de moldes mas largas (carriles 6-9). El carril 10 muestra inhibicion de ligasa esencialmente completa debido al desapareamiento de molde-sonda (molde - 5' CGCG 3').
5
10
15
20
25
30
35
40
45
50
55
60
Los resultados del gel mostrados en la Figura 7E demuestran multiples ligaciones dirigidas por molde de una sonda de hexanucleotido modificada con bis(amino). Las modificadores de amino alifaticas fueron del enlace y composicion descritos en la Figura 26. Para este ejemplo, un sustrato oligomerico de hexanucleotido de la secuencia 5' (fosfato) C A (amino)C (amino)A C A 3' se hibrido con una variedad de moldes complementarios progresivamente mas largos (duplexados con un cebador de extension) en presencia de un cebador y ADN ligasa t4. El nucleotido protuberante del extremo si duplexar (si lo hay) fue entonces digerido por nucleasa y los productos de ligacion se separaron sobre un gel de acrilamida al 20 %. La ligacion produce polfmeros producto que contienen subunidades demostrablemente ligadas. Los carriles 1 y 2 representan controles de tamano 16mero y 20mero. Los carriles 3, 4, 5, 6, 7, 8 y 9 muestran productos de ligacion para moldes complementarios progresivamente mas largos (4, 6, 8, 12, 16, 18 y 20 bases de molde, respectivamente). Se observan multiples ligaciones de tetramero para reacciones de moldes mas largas (carriles 5-9). El carril 10 muestra inhibicion de ligasa casi completa debido al desapareamiento de molde- sonda (molde - 5' CGCGCG 3').
Los sustratos incluyen tanto miembros de sonda (es decir, oligomeros como miembros de union espedficos de molde para ensamblar el producto intermedio de Xpandomero) como monomeros (es decir, miembros de nucleobase individuales como elementos de union espedficos de molde). Los presentes inventores llaman a los primeros sustratos “tipo sonda” y a los segundos sustratos “tipo monomero”. Como se ilustra en la Figura 8, los Xpandomeros tipo sonda tienen cinco subgeneros basicos, mientras que la Figura 9 ilustra cinco subgeneros basicos de Xpandomeros tipo monomero. Las tablas de las Figuras 8 y 9 incluyen tres columnas: la primera que describe construcciones de sustrato, la segunda productos intermedios de Xpandomeros y la tercera los productos de Xpandomero caractensticos del subgenero (por fila). Las tablas se proporcionan aqrn como una vision general, con metodos que hacen y usan lo mismo que se ha desvelado en mayor detalle en el presente documento mas adelante. En las Figuras 8 y 9, “P” se refiere a una miembro de sonda, “T” a un miembro de anclaje (o anclaje de bucle o precursor del brazo de anclaje), “N” a un monomero (una nucleobase individual o residuo de nucleobase) y “R” a un grupo terminal.
Mas espedficamente, en la tabla de la Figura 8 se usa la siguiente nomenclatura:
P es un miembro de sustrato de sonda y esta compuesto por P1-P2, en la que P1 es un primer resto de sonda y P2 es un segundo resto de sonda;
T es un anclaje;
Los corchetes indican una subunidad de la hebra hija, en la que cada subunidad es un motivo de subunidad que tiene un miembro de sonda espedfico de especie, adicionalmente en la que dichos miembros de sonda de dichos motivos de subunidad son secuencialmente complementarios a la secuencia de nucleotidos contigua correspondiente de la hebra molde, indicada aqrn P1 - P2, y forman un esqueleto primario del producto intermedio de Xpandomero, y en la que los miembros de anclaje, opcionalmente en combinacion con los restos de sonda, forman un esqueleto de Xpandomero limitado. La escision de uno o mas enlaces selectivamente escindibles dentro del producto intermedio de Xpandomero permite la expansion de las subunidades para producir un producto de Xpandomero, cuyas subunidades tambien se indican con corchetes; a indica una especie de motivo de subunidad seleccionado de una biblioteca de motivos de subunidad; s es un primer grupo conector unido a un primer extremo o resto de un miembro de sonda o anclaje; bajo condiciones controladas, s es capaz de reaccionar selectivamente con, directamente o mediante reticuladores, el grupo conector 8 de un extremo confinado de una subunidad adyacente para formar enlaces covalentes o equivalentemente duraderos;
8 es un segundo grupo conector unido a un primer extremo o resto de un miembro de sonda o anclaje; bajo condiciones controladas, 8 es capaz de reaccionar selectivamente con, directamente o mediante reticuladores, el grupo conector s de un extremo confinado de una subunidad adyacente para formar enlaces covalentes o equivalentemente duraderos;
X representa un enlace con una subunidad adyacente y es el enlace producto de la reaccion de los grupos conectores 8 y s;
~ indica un enlace selectivamente escindible, que puede ser igual o diferente cuando estan presentes multiples enlaces selectivamente escindibles;
R1 incluye, pero no se limita a, hidroxilo, hidrogeno, trifosfato, monofosfato, ester, eter, glicol, amina, amida y tioester;
R2 incluye, pero no se limita a, hidroxilo, hidrogeno, trifosfato, monofosfato, ester, eter, glicol, amina, amida y tioester; y
k indica la subunidad kn en una cadena de m subunidades, en la que k =1, 2, ... a m, en la que m>3, y generalmente m>20, y preferentemente m>50, y mas preferencialmente m>1000.
Mas espedficamente, y en el contexto de la tabla de la Figura 9, se usa la siguiente nomenclatura:
N es un residuo de nucleobase;
T es un anclaje;
Los corchetes indican una subunidad de la hebra hija, en la que cada subunidad es un motivo de subunidad que tiene un residuo de nucleobase espedfico de especie, adicionalmente en la que dichos residuos de nucleobase de dichos motivos de subunidad son secuencialmente complementarios a la secuencia de
5
10
15
20
25
30
35
40
45
50
55
60
nucleotidos contigua correspondiente de la hebra molde, indicada aqm N, y forman un esqueleto primario del producto intermedio de Xpandomero, y en la que los miembros de anclaje, opcionalmente en combinacion con los residuos de nucleobase, forman un esqueleto de Xpandomero limitado. La escision de uno o mas enlaces selectivamente escindibles dentro del producto intermedio de Xpandomero permite la expansion de las subunidades para producir un producto de Xpandomero, cuyas subunidades tambien se indican con corchetes; n1 es una primera porcion de un residuo de nucleobase; n2 es una segunda porcion de un residuo de nucleobase;
e es un primer grupo conector unido a un primer extremo o resto de un miembro de sonda o anclaje; bajo condiciones controladas, e es capaz de reaccionar selectivamente con, directamente o mediante reticuladores, el grupo conector 8 de un extremo confinado de una subunidad adyacente para formar enlaces covalentes o equivalentemente duraderos;
8 es un segundo grupo conector unido a un primer extremo o resto de un miembro de sonda o anclaje; bajo condiciones controladas, 8 es capaz de reaccionar selectivamente con, directamente o mediante reticuladores, el grupo conector e de un extremo confinado de una subunidad adyacente para formar enlaces covalentes o equivalentemente duraderos;
X representa un enlace con una subunidad adyacente y es el enlace producto de la reaccion de grupos de enlace 8 y e;
XI es el enlace producto de la reaccion de grupos de enlace 81 y e1;
X2 es el enlace producto de la reaccion de grupos de enlace 82 y e2;
~ indica un enlace selectivamente escindible, que puede ser igual o diferente cuando estan presentes multiples enlaces selectivamente escindibles;
R1 incluye, pero no se limita a, hidroxilo, hidrogeno, trifosfato, monofosfato, ester, eter, glicol, amina, amida y tioester;
R2 incluye, pero no se limita a, hidroxilo, hidrogeno, trifosfato, monofosfato, ester, eter, glicol, amina, amida y tioester; y
k indica la subunidad kn en una cadena de m subunidades, en la que k =1, 2, ... a m, en la que m>10, y generalmente m>50, y normalmente m>500 o >5.000.
Construcciones oligomericas
Los precursores y construcciones de Xpandomero pueden dividirse en dos categonas basandose en el sustrato (oligomerico o monomerico) usado para el ensamblaje dirigido por molde. La estructura, precursores y metodos de smtesis del Xpandomero para aquellos basados en los sustratos de oligomero se tratan a continuacion.
Las construcciones de sustrato son precursores reactivos para el Xpandomero y generalmente tienen un miembro de anclaje y un sustrato. El sustrato tratado aqm es un sustrato de oligomero o sonda, generalmente constituido de una pluralidad de residuos de nucleobase. Generando bibliotecas de tipo combinatorias de dos a veinte residuos de nucleobase por sonda, generalmente 2 a 10 y normalmente 2, 3, 4, 5 o 6 residuos de nucleobase por sonda, se generan bibliotecas de sonda utiles como reactivos en la smtesis de precursores de Xpandomeros (construcciones de sustrato).
La sonda se describe generalmente como que tiene dos restos de sonda, P1 y P2. Estos restos de sonda estan generalmente representados en las figuras como dinucleotidos, pero en general P1 y P2 tienen cada uno al menos un residuo de nucleobase. En el ejemplo de una sonda con dos residuos de nucleobase, los restos de sonda P1 y P2 senan residuos de nucleobase individuales. El numero de residuos de nucleobase para cada uno se elige, apropiadamente, para el metodo de smtesis del Xpandomero y puede no ser igual en P1 y P2.
Para las construcciones de sustrato en las que se usan los grupos conectores e y 8 para crear enlaces inter- subunidad, un amplio intervalo de qmmicas comercialmente disponibles adecuadas (Pierce, Thermo Fisher Scientific, EE.UU.) puede adaptarse para este fin. Qmmicas de conectores comunes incluyen, por ejemplo, esteres de NHS con aminas, maleimidas con sulfhidrilos, imidoesteres con aminas, EDC con carboxilos para reacciones con aminas, disulfuros de piridilo con sulfhidrilos, y similares. Otras realizaciones implican el uso de grupos funcionales como hidrazida (HZ) y 4-formilbenzoato (4FB) que pueden entonces hacerse reaccionar adicionalmente para formar enlaces. Mas espedficamente, estan ampliamente disponibles (Pierce) un amplio intervalo de reticuladores (hetero- y homo-bifuncionales) que incluyen, pero no se limitan a, sulfo-SMCC (4-[N-maleimidometil]ciclohexano-1- carboxilato de sulfosuccinimidilo), SIA (yodoacetato de N-succinimidilo), sulfo-EMCS (ester de [N-e- maleimidocaproiloxi]sulfosuccinimida), sulfo-GMBS (ester de N-[g-maleimidobutiriloxi]sulfosuccinimida), AMAS (ester de N-(a-maleimidoacetoxi)succinimida), BMPS (N EMCA acido (N-e-maleimidocaproico)-ester de [U- maleimidopropiloxi]succinimida), EDC (clorhidrato de 1-etil-3-[3-dimetilaminopropil]carbodiimida), SANPAH (N- succinimidil-6-[4'-azido-2'-nitrofenilamino]hexanoato), SADP (N-succinimidil(4-azidofenil)-1,3'-ditiopropionato), PMPI (N-[p-Maleimidofenil]isocianato, BMPH (hidrazida del acido N-[p-maleimidopropionico], sal del acido trifluoroacetico)), EMCH (hidrazida del acido [N-e-maleimidocaproico], sal del acido trifluoroacetico), SANH (4-hidrazinonicotinato- acetonahidrazona de succinimidilo), SHTH (clorhidrato de 4-hidrazidotereftalato de succinimidilo) y C6-SFB (4- formilbenzoato de C6-succinimidilo). Por tanto, el metodo desvelado por Letsinger et al. (“Phosphorothioate oligonucleotides having modified internucleoside linkages”, patente de EE.UU. N° 6.242.589) puede adaptarse para formar enlaces fosforotiolato.
5
10
15
20
25
30
35
40
45
50
55
Ademas, estan ampliamente disponibles qmmicas de proteccion/desproteccion bien establecidas para restos de conector comunes (Benoiton, “Chemistry of Peptide Synthesis”, CRC Press, 2005). La proteccion de amino incluye, pero no se limita a, carbamato de 9-fluorenilmetilo (Fmoc-NRR'), carbamato de t-butilo (Boc-NRR'), carbamato de bencilo (Z-NRR', Cbz-NRR'), acetamida-trifluoroacetamida, ftalimida, bencilamina (Bn-NRR'), trifenilmetilamina (Tr- NRR') y bencilidenamina-p-toluenosulfonamida (Ts-NRR'). La proteccion de carboxilo incluye, pero no se limita a, ester metilico, ester t-butilico, ester bendlico, ester s-t-butilico y 2-alquil-1,3-oxazolina. Carbonilo incluyen, pero no se limitan a, 1,3-dioxano de dimetilacetal, y N,N-dimetilhidrazona de 1,3-ditiano. Proteccion de hidroxilo incluye, pero no se limita a, eter metoximetilico (MOM-OR), eter tetrahidropiramlico (THP-OR), eter t-butilico, eter alflico, eter bendlico (Bn-OR), eter t-butildimetilsilflico (TbDMS-OR), eter t-butildifenilsiKlico (TBDPS-OR), ester del acido acetico, ester del acido pivalico y ester del acido benzoico.
Aunque el anclaje se representa frecuentemente como una construccion de indicador con tres grupos indicadores, diversas configuraciones de indicador pueden presentarse sobre el anclaje, y pueden comprender indicadores individuales que identifican constituyentes de sonda, indicadores individuales que identifican especies de sonda, codigos de barras moleculares que identifican especies de sondas, o el anclaje puede ser polfmero desnudo (que no tiene indicadores). En el caso del polfmero desnudo, los indicadores pueden ser la propia sonda, o pueden estar sobre un segundo anclaje unido a la sonda. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
Como se trata anteriormente, la Figura 8 proporciona una vision general de construcciones oligomericas de la invencion, distinguiendose cinco clases: clases I, II, III, IV, y V. Estas clases se aplican a tanto Xsondas como a Xmeros. Cada clase se tratara individualmente a continuacion.
Construcciones oligomericas de clase I
Volviendo a la Figura 10, las construcciones oligomericas de clase I se describen en mas detalle. Las Figuras 10A a 10C emplean una notacion adaptada para mostrar estas moleculas como sustratos y como productos de hetero- copolfmero del proceso de SBX. Las figuras se leen de izquierda a derecha, mostrando primero la construccion de sonda-sustrato (precursor oligomerico de Xpandomero), luego la hebra hija del duplex intermedia en el centro, y a la derecha el producto de Xpandomero preparado para la secuenciacion.
Como se muestra en la Figura 10A, una construccion de sustrato de clase I tiene un miembro de sonda oligomerico (-P1~P2-) (100) y un miembro de anclaje, T (99). El anclaje esta unido por dos enlaces terminales (108,109) a restos de sonda P1 y P2. Estas limitaciones previenen que el anclaje se alargue o expanda y asf en una configuracion limitada. Bajo ensamblaje dirigido por molde, los sustratos forman un duplex con el molde diana de forma que los sustratos esten confinados.
R1 y R2 son grupos terminales configurados segun convenga para el protocolo de smtesis en el que se usa la construccion de sustrato. Por ejemplo, R1 = 5'-fosfato y R2 = 3'-Oh, encontranan uso en un protocolo de ligacion, y R1 = 5'-trifosfato y R2 = 3'-OH para un protocolo de polimerasa I. Opcionalmente, R2 puede configurarse con un grupo de bloqueo reversible para la adicion dclica de un unico sustrato. Alternativamente, R1 y R2 pueden configurarse con grupos conectores terminales para el acoplamiento qmmico o con grupos no conectores para un protocolo de solo hibridacion. R1 y R2 pueden ser del tipo general XR, en la que X es un grupo de enlace y R es un grupo funcional.
La tilde (~) en la Figura 10A y 10B indica un enlace selectivamente escindible que separa dos restos del miembro de sonda. Los enlaces terminales del anclaje estan unidos a los dos restos del miembro de sonda que se separan por el enlace selectivamente escindible. El anclaje enlaza el primer resto de sonda con el segundo resto de sonda, formando un bucle que conecta el enlace selectivamente escindible. Cuando el miembro de sonda esta intacto (sin escindir), el miembro de sonda puede unirse con alta fidelidad a la secuencia molde y el anclaje forma un bucle en la “configuracion limitada”. Cuando este enlace se escinde, el bucle de anclaje puede abrirse y el anclaje esta en la “configuracion expandida”.
Las construcciones de sustrato son reactivos usados para el ensamblaje dependiente de molde de una hebra hija, que es una composicion intermedia para producir Xpandomeros. La Figura 10B muestra la hebra hija de duplex, un hetero-copolfmero con subunidades de repeticion (mostradas en corchetes). Se muestran el esqueleto primario de la hebra hija (-P1~P2-) y la hebra molde diana (-P1- P2-) como un duplex (95). Cada subunidad de la hebra hija es un motivo de repeticion compuesto de un miembro de sonda y un miembro de anclaje, T (99), el miembro de anclaje en configuracion limitada. Los motivos tienen variabilidad espedfica de especie, indicada aqrn por el supermdice “a”. Cada subunidad particular en la hebra hija se selecciona de una biblioteca de motivos por un proceso dirigido por molde y su sonda se une a una secuencia correspondiente de nucleotidos complementarios sobre la hebra molde. De esta forma, la secuencia de residuos de nucleobase de las sondas forma una copia complementaria contigua de la hembra molde diana.
La hebra hija esta compuesta por un precursor de Xpandomero llamado el “Xpandomero limitado” que esta adicionalmente compuesto de anclajes en la “configuracion limitada”. Cuando los anclajes (99) se convierten en su
5
10
15
20
25
30
35
40
45
50
55
“configuracion expandida”, el Xpandomero limitado se convierte en el producto de Xpandomero.
Puede observarse que la hebra hija tiene dos esqueletos, un “esqueleto primario” y el esqueleto del “Xpandomero limitado”. El esqueleto primario esta compuesto por sustratos de sonda contiguamente confinados. El “esqueleto de Xpandomero limitado” evita el enlace selectivamente escindible entre los restos de sonda P1 y P2 y se forma por restos de esqueleto enlazados, siendo cada resto de esqueleto un enlace lineal de P1 al anclaje a P2, y en el que P2 puede enlazarse adicionalmente con el P1 del siguiente resto de esqueleto. Puede observarse que el esqueleto de Xpandomero limitado conecta o forma un bucle sobre los enlaces selectivamente escindibles del esqueleto primario, y seguira covalentemente intacto cuando estos enlaces selectivamente escindibles se escindan y el esqueleto primario se fragmente.
La Figura 10C es una representacion del producto de Xpandomero de clase I despues de la disociacion de la hebra molde y despues de la escision de los enlaces selectivamente escindibles del esqueleto primario. Metodos para la disociacion de la hebra molde incluyen desnaturalizacion por calor, o digestion selectiva con una nucleasa, o degradacion qmmica. La hebra del producto de Xpandomero contiene una pluralidad de subunidades k, en las que k indica la subunidad Kn en una cadena de m subunidades que constituyen la hebra hija, en la que k = 1,2, 3 a m, en la que m>3, y generalmente m>20, y preferentemente m>50, y mas preferencialmente m>1000. Cada subunidad esta formada de un anclaje (99) y restos de sonda P1 y P2. El miembro de anclaje T, ahora en “configuracion expandida”, se observa estirado a su longitud entre los restos de sonda escindidos P1 y P2, que siguen ligados covalentemente a las subunidades adyacentes. Cada subunidad, un motivo de subunidad a, contiene informacion genetica espedfica de especie establecida por el ensamblaje dirigido por molde del producto intermedio de Xpandomero (hebra hija).
La Figura 10D muestra la construccion de sustrato de la Figura 10A como modelo molecular, en la que el miembro de sonda (100) se representa arbitrariamente con cuatro residuos de nucleobase (101,102,103,104), dos de los cuales (102,103) se unen al anclaje (99) por enlaces terminales (108,109). Entre los dos enlaces terminales del anclaje esta un enlace selectivamente escindible, mostrado como “V” (110) en el miembro de sonda (100). Este enlace une restos de sonda P1 y P2 referidos en la Figura 10A. El bucle de anclaje mostrado aqrn tiene tres indicadores (105,106,107), que tambien pueden ser espedficos de especies de motivos.
La Figura 10E muestra el Xpandomero producto despues de la escision de los enlaces selectivamente escindibles en el sustrato. La escision produce la expansion del Xpandomero limitado y se indica por “E” (flechas oscuras). Los residuos (110a,110b) del enlace selectivamente escindible marcan el acontecimiento de escision. La subunidad esta indicada por lmeas de puntos que agrupan verticalmente la subunidad de repeticion, como se representa por los corchetes en la Figura 10C adjunta.
En el producto de Xpandomero (Figura 10E) el esqueleto primario esta ahora fragmentado y no esta covalentemente intacto debido a que los miembros de sonda se han escindido, separando cada P1 (92) y P2 (94). Durante el proceso de escision, el Xpandomero limitado se libera para convertirse en el producto de Xpandomero. El Xpandomero incluye cada subunidad concatenada en la secuencia. Ligados dentro de cada subunidad estan el resto de sonda P1, el anclaje y resto de sonda P2. Los miembros de anclaje (99) del Xpandomero que estuvieron anteriormente en la configuracion limitada estan ahora en la configuracion expandida, sirviendo asf para estirar linealmente la informacion de secuencias de la diana molde. La expansion de los anclajes reduce la densidad lineal de la informacion de secuencias a lo largo del Xpandomero y proporciona una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion y descodificacion de la secuencia molde.
La Figura 11 representa un esquema condensado de un metodo de preparacion de una realizacion de un Xpandomero de clase I; el metodo ilustra la preparacion y uso de sustratos y productos mostrados en las Figuras 10D y 10E. El metodo puede realizarse en disolucion libre y se describe usando una ligasa (L) para acoplar covalentemente Xsondas confinadas. Los metodos de alivio de la estructura secundaria en el molde se tratan en una seccion posterior. Condiciones adaptadas para la hibridacion y ligacion son muy conocidas en la tecnica y tales condiciones pueden ser facilmente optimizadas por un experto en este campo.
Las ligasas incluyen, pero no se limitan a, ligasas dependientes de NAD+ que incluyen ARNt ligasa, ADN ligasa Taq, ADN ligasa de Thermus filiformis, ADN ligasa de Escherichia coli, aDn ligasa Tth, ADN ligasa de Thermus scotoductus, ligasa termoestable, ADN ligasa termoestable Ampligasa, ligasa tipo VanC, ADN ligasa 9°N, ADN ligasa Tsp, y novedosas ligasas descubiertas por bioprospeccion. Las ligasas tambien incluyen, pero no se limitan a, ligasas dependientes de ATP que incluyen ARN ligasa T4, ADN ligasa T4, ADN ligasa T7, ADN ligasa Pfu, ADN ligasa I, aDn ligasa III, ADN ligasa IV, y novedosas ligasas descubiertas por bioprospeccion. Estas ligasas incluyen isoformas no mutantes, mutantes, y variantes geneticamente manipuladas.
Con referencia a la Figura 11, y en la preparacion para la smtesis, se proporciona un acido nucleico diana (110) y los extremos se pulen en la preparacion para la ligacion de extremos romos de adaptadores. La etapa I muestra la ligacion de cebadores en horquilla (120) con el acido nucleico diana. El extremo 5' libre de los cebadores se bloquea con un grupo de bloqueo movible (119). Los cebadores cebaran ambas hebras del acido nucleico diana. Los adaptadores se anaden generalmente en exceso. Los grupos de bloqueo sobre los extremos calientes de los
5
10
15
20
25
30
35
40
45
50
55
60
cebadores se eliminan en la etapa II, y las dos hebras del molde se separan por desnaturalizacion. En la etapa III, el molde monocatenario cebado (111) se pone en contacto con una biblioteca de construcciones de sustrato (como se representa por la construccion (112) para fin de ilustracion) y con ligasa, L, en condiciones permisibles para la hibridacion de sustrato de sonda complementaria (113) y ligacion en el extremo reactivo del cebador, como se muestra en la etapa IV. Generalmente, la hibridacion y ligacion se realizan a una temperatura superior a la temperatura de fusion del sustrato para reducir reacciones secundarias no espedficas. Cada construccion de sustrato en este ejemplo contiene un anclaje que presenta tres indicadores. Cada sustrato de sonda tiene un enlace selectivamente escindible (indicado con una “V”) entre los dos sitios de union del anclaje. En la etapa V, una segunda construccion de sustrato (114) se anade por hibridacion y ligacion dirigida por molde, etc. En la etapa VI se demuestra la formacion de un producto intermedio de Xpandomero completamente extendido (117). Este producto intermedio puede desnaturalizarse de la hebra molde y escindirse selectivamente en los sitios de escision mostrados, formando asf un Xpandomero producto adecuado para la secuenciacion. En algunas realizaciones no se necesita la desnaturalizacion y la hebra molde puede digerirse en su lugar.
La Figura 12 es un esquema condensado de un segundo metodo, aqrn para la preparacion de otra realizacion de un Xpandomero de clase I. En la preparacion para la smtesis, se proporciona un acido nucleico diana (120) y los extremos se pulen en preparacion para la ligacion de extremos romos de adaptadores (121,122). La etapa I muestra la ligacion de precursores de cebador en horquilla doblemente bloqueados al acido nucleico diana. Un extremo de los cebadores en horquilla del duplex se bloquea con grupos de bloqueo movibles (125a,125b,125c,125d) previstos para prevenir la ligacion y concatenacion de las hebras molde o adaptadores. Los adaptadores se anaden generalmente en exceso. Los grupos de bloqueo se eliminan en la etapa II, y las dos hebras del molde se separan por desnaturalizacion. En la etapa III, los cebadores en horquilla se auto-hibridan, formando sitios de cebado (126,127) para la posterior ligacion de construcciones de sustrato, que puede avanzar bidireccionalmente, es decir, tanto en una direccion 3' a 5' como una 5' a 3'. En la etapa IV, los moldes cebados se ponen en contacto con una biblioteca de construcciones de sustrato (128) en condiciones permisibles para la hibridacion de sustratos de sonda complementaria y ligacion. La ligacion avanza incrementalmente (es decir, extendiendo los extremos en crecimiento con procesividad aparente) por un proceso de hibridacion de sustratos de sonda complementaria y ligacion en los extremos de las hebras hija nacientes. Cada construccion de sustrato en este ejemplo contiene un bucle de anclaje que presenta grupos indicadores. En la etapa V se representa la formacion de un producto intermedio de Xpandomero completado (129). Opcionalmente, la hebra molde puede eliminarse por digestion con nucleasa, liberando el Xpandomero. El producto intermedio puede escindirse selectivamente en los sitios de escision mostrados, formando asf un Xpandomero producto adecuado para la secuenciacion. Los Xpandomeros producto se forman en disolucion libre.
En la Figura 13 se muestra un metodo que se basa en hebras molde inmovilizadas. Aqrn, las hebras molde estan ancladas a una perla (u otro soporte de fase solida) por un adaptador (131). El molde se muestra en contacto con construcciones de sustrato (132), y en la etapa I, las condiciones estan adaptadas de manera que se produzca la hibridacion. Puede observarse que se forman “islas” de construcciones de sustrato confinadas hibridadas. En la etapa II, la adicion de ligasa, L, produce la ligacion de las construcciones de sustrato confinadas, formando asf multiples secuencias contiguas de productos intermedios ligados separados por huecos. En la etapa III, las condiciones se ajustan para favorecer la disociacion de material hibridado de bajo peso molecular o desapareado, y en la etapa IV, las reacciones de las etapas II a III se repiten una o mas veces para favorecer la formacion de productos de extension mas largos. Este proceso sin cebador se denomina en el presente documento “ligacion promiscua”. La ligacion puede extenderse bidireccionalmente e intersecciones cortadas y empalmadas pueden sellarse con ligasa, llenando asf los huecos. En la etapa V, despues de la optimizacion de las longitudes de producto deseadas, los duplex inmovilizados se lavan para eliminar sustrato y ligasa sin reaccionar. Entonces, en la etapa VI, las hebras hija (aqrn mostradas como un producto intermedio de Xpandomero monocatenario) (138,139) se disocian del molde. La escision selectiva de enlaces selectivamente escindibles del producto intermedio produce la formacion del producto de Xpandomero (no mostrado). En esta realizacion, el molde inmovilizado puede volver a utilizarse. Una vez se secuencian los productos de Xpandomero, los contigos pueden ensamblarse por algoritmos muy conocidos para solapar y alinear los datos para construir una secuencia consenso.
Con referencia a la Figura 14, se muestra un metodo de uso de cebadores inmovilizados. Los moldes adaptados en los extremos (o secuencias molde aleatorias, dependiendo de la naturaleza de los cebadores inmovilizados) (142) se hibridan con los cebadores inmovilizados (140) en la etapa I. En la etapa II, los moldes inmovilizados (143) se ponen en contacto con una biblioteca de construcciones de sustrato, cuyos miembros se muestran como (144), y las condiciones se ajustan para la hibridacion dirigida por molde. En este ejemplo, los extremos 3' OH de la construccion de sustrato de los miembros de sonda (grupo R) se ha sustituido (146) para bloquear reversiblemente adicionalmente la extension. En la etapa III, los extremos confinados de la construccion de sustrato adyacente y cebador, o extremo libre de la hebra hija en crecimiento naciente, se ligan y el extremo 3' OH de la hebra hija naciente se activa eliminando el grupo R de bloqueo (146). Como se indica en las etapas IV y V, este proceso de adicion dclica escalonada puede repetirse multiples veces. Normalmente, se usa una etapa de lavado para eliminar sustratos sin reaccionar entre cada etapa de extension.
El proceso es asf analogo a lo que se llama “extension dclica de una unica base”, pero se llamana mas apropiadamente aqrn “extension dclica de una unica sonda”. Aunque se muestra la ligasa, L, el proceso puede realizarse con una ligasa, polimerasa, o por cualquier protocolo de acoplamiento qrnmico adecuado para unir
5
10
15
20
25
30
35
40
45
50
55
60
oligomeros en una smtesis dirigida por molde. El acoplamiento qmmico puede producirse espontaneamente en los extremos confinados de las sondas hibridadas, o un agente de condensacion puede anadirse al principio de la etapa III y cada etapa V resultante del ciclo. El grupo R de bloqueo terminal esta configurado de manera que la polimerizacion iniciada libre no pueda producirse sobre el molde o en disolucion. La etapa VI muestra la formacion de un producto intermedio de Xpandomero completo (149); no puede anadirse mas sustrato. Este producto intermedio puede disociarse del molde, el producto monocatenario se escinde entonces para abrir el esqueleto como se describe previamente.
Este metodo puede adaptarse para la secuenciacion selectiva de dianas particulares en una mezcla de acidos nucleicos, y para analizar metodos de secuenciacion sobre matrices de secuenciacion, por ejemplo, por seleccion no aleatoria de los cebadores inmovilizados. Alternativamente, pueden usarse cebadores universales o aleatorios como se muestra.
La Figura 15 describe un metodo de hibridacion promiscua sobre un molde inmovilizado (150) (etapa I), en el que las construcciones de sustrato de la biblioteca (152) se modifican con un grupo funcional qmmico que es selectivamente reactivo (156), representado como un triangulo abierto, con una sonda confinada. Un detalle del grupo funcional qmmico de las construcciones de sustrato se muestra en la porcion expandida mostrada por el drculo en trama (Figura 15a). A una cierta densidad de hibridacion, el acoplamiento se inicia como se muestra en la etapa II, produciendo productos intermedios de Xpandomero de alto peso molecular enlazados por el producto reticulado (157), representado como un triangulo relleno, de la reaccion de acoplamiento. Un detalle de las sondas reticuladas se muestra en la porcion expandida mostrada en el drculo en trama (Figura 15b) en el producto de la etapa II. Este proceso puede ir acompanado por etapas para la disociacion selectiva y eliminacion de productos de bajo peso molecular y cualquier posible producto desapareado. Las qmmicas de acoplamiento para este metodo de acoplamiento qmmico promiscuo son conocidas para algunos expertos en la materia e incluyen, por ejemplo, las tecnicas desveladas en la patente de EE.UU. N°. 6.951.720 a Burgin et al.
En otra realizacion, se desvelan metodos basados en polimerasa para ensamblar Xpandomeros producto. Generalmente, los trifosfatos de sustrato (Xmeros) son el sustrato apropiado para reacciones que implican a una polimerasa. La seleccion de una polimerasa adecuada es parte de un proceso de optimizacion del protocolo experimental. Como se muestra en la Figura 16 para ilustracion, y aunque no se pretende que sea limitante, se pone en contacto una mezcla de reaccion que contiene un molde (160) y un cebador (161) con una biblioteca de construcciones de sustrato (162) y una polimerasa (P), en condiciones optimizadas para la polimerizacion dirigida por molde. En la etapa I, la polimerasa empieza a anadir procesivamente Xmeros de dinucleotido (anclajes con dos indicadores) a la hebra molde. Este proceso continua en las etapas II y III. Cada subunidad de sonda anadida es una especie particular seleccionada por union espedfica al siguiente oligomero adyacente del molde de manera que forme una copia complementaria continua del molde. Aunque no esta ligado por teona, se cree que la polimerasa ayuda en asegurar que las especies de sondas entrantes anadidas con la cadena naciente sean espedficamente complementarias al siguiente segmento contiguo disponible del molde. Loeb y Patel describen ADN polimerasas mutantes con elevada actividad y fidelidad mejorada (patente de EE.UU. N°. 6.329.178). Williams, por ejemplo, en la solicitud de patente de EE.UU. 2007/0048748 ha mostrado que las polimerasas pueden modificarse para elevada velocidad de incorporacion y reduccion en la tasa de error, enlazando claramente la tasa de error no con la exactitud de hibridacion, sino con la procesividad de polimerasa. La etapa III produce un producto intermedio de Xpandomero completado (168). El producto intermedio de Xpandomero monocatenario se trata entonces por una manera de proceder que puede implicar la desnaturalizacion de la hebra molde (no mostrada). El esqueleto primario de la hebra hija se escinde selectivamente para expandir los anclajes, formando asf un producto de Xpandomero adecuado para su uso en un protocolo de secuenciacion, como se ha explicado previamente.
Como se muestra en la Figura 17, la smtesis dirigida por molde conducida por polimerasa de un Xpandomero puede lograrse por tecnicas alternativas. Aqm, un cebador inmovilizado (170) con el que se hibrida una hebra molde procesada (171) en la etapa I. En la etapa II, la polimerasa, P, se acopla procesivamente espedficamente con construcciones de sustrato complementarias (175) de una biblioteca de tales construcciones (representadas por 174) en la mezcla de reaccion. Las condiciones y disoluciones de reactivo se ajustan para favorecer la actividad de polimerasa procesiva. Como se muestra aqm, la hibridacion en la etapa II y la polimerizacion en la etapa III son actividades separadas, pero las actividades de la polimerasa no necesitan aislarse de esa forma. En la etapa IV, la adicion procesiva incremental de construcciones de sustrato complementarias continua dclicamente (continuamente sin interrupcion), produciendo el producto intermedio de Xpandomero completamente cargado (177) como se representa resultante de la etapa IV. El producto intermedio de Xpandomero puede disociarse y expandirse en preparacion para su uso en un protocolo de secuenciacion como se describe previamente. Observese que este metodo tambien se presta a metodos de secuenciacion analizados por seleccion de cebadores inmovilizados adecuados. Ademas, los metodos para estirar el molde para liberar la estructura secundaria estan facilmente adaptados a este metodo, y se tratan en secciones posteriores.
Polimerasas incluyen, pero no se limitan a, ADN polimerasas dependientes de ADN, ARN polimerasas dependientes de ADN, ADN polimerasas dependientes de ARN, ARN polimerasas dependientes de ARN, ADN polimerasa T7, ADN polimerasa T3, ADN polimerasa T4, ARN polimerasa T7, ARN polimerasa T3, ARN polimerasa SP6, ADN polimerasa I, fragmento de Klenow, ADN polimerasa de Thermophilus aquaticus, ADN polimerasa Tth, ADN polimerasa VentR® (New England Biolabs), ADN polimerasa Deep VentR® (New England Biolabs), fragmento grande
5
10
15
20
25
30
35
40
45
50
55
de ADN polimerasa Bst, fragmento de Stoeffel, ADN polimerasa 9°N, ADN polimerasa 9°N, ADN Polimerasa Pfu, ADN polimerasa Tfl, ADN polimerasa Tth, polimerasa RepliPHI Phi29, ADN polimerasa TIi, ADN polimerasa beta de eucariota, telomerasa, polimerasa Therminator™ (New England Biolabs ADN polimerasa), KOD HiFi™ (Novagen), ADN polimerasa KOD1, Q-beta replicasa, transferasa terminal, transcriptasa inversa AMV, transcriptasa inversa MMLV, transcriptasa inversa Phi6, transcriptasa inversa del VIH-1, polimerasas novedosas descubiertas por bioprospeccion, y polimerasas citadas en los documentos US 2007/0048748, US 6.329.178, US 6.602.695 y US 6.395.524. Estas polimerasas incluyen isoformas no mutantes, mutantes, y variantes geneticamente manipuladas.
Construcciones oligomericas de clase II y III
Con referencia a las Figuras 18A a 18E, describen construcciones oligomericas de clase II en mas detalle, que (junto con las construcciones oligomericas de clase III isomericas) pueden ser tanto Xsondas como Xmeros.
Las Figuras 18A a 18C se leen de izquierda a derecha, mostrando primero la construccion de sonda-sustrato (precursor oligomerico de Xpandomero), luego la hebra hija del duplex intermedia en el centro, y a la derecha el producto de Xpandomero preparado para la secuenciacion.
Como se muestra en la Figura 18A, una construccion de sustrato de clase II tiene un miembro de sonda oligomerico (-P1-P2-) (180) y un miembro de anclaje, T (181). El anclaje esta unido por un unico enlace terminal (184) de un primer resto terminal al resto de sonda P2. En el extremo distal del anclaje (186), un segundo resto terminal tiene un grupo conector 8 y esta posicionado proximo a R2. El segundo resto terminal tambien tiene una reticulacion intra- anclaje escindible (187) para limitarlo a esta localizacion. La reticulacion escindible (187) se indica por una lmea de puntos, que puede indicar, por ejemplo, un enlace disulfuro. Estas limitaciones previenen que el anclaje se alargue o expanda y asf esta en una configuracion limitada. Un segundo grupo conector e esta posicionado cerca del extremo distal (189) del miembro de sonda cerca de R1. Bajo ensamblaje dirigido por molde, los sustratos forman un duplex con el molde diana de forma que los sustratos esten confinados. Bajo condiciones controladas, los grupos conectores 8 y e de los sustratos confinados se enlazan para formar un enlace % entre las construcciones de sustrato adyacentes (mostradas en las Figuras 18B y 18C). Estos grupos de enlace estan posicionados sobre la construccion de sustrato para limitar estas reacciones de enlace con construcciones de sustrato confinadas adyacentes. La construccion de sustrato no se enlaza preferencialmente consigo misma. Qmmicas de enlace y de proteccion/desproteccion adecuadas para 8, e y % se detallan en la descripcion de la construccion oligomerica general.
R1 y R2 son grupos terminales configurados segun convenga para el protocolo de smtesis en el que se usa la construccion de sustrato. Por ejemplo, R1 = 5'-fosfato y R2 = 3'-Oh, encontranan uso en un protocolo de ligacion, y R1 = 5'-trifosfato y R2 = 3'-OH para un protocolo de polimerasa I. Opcionalmente, R2 puede configurarse con un grupo de bloqueo reversible para la adicion dclica de un unico sustrato. Alternativamente, R1 y R2 pueden configurarse con los grupos conectores terminales para el acoplamiento qmmico o con grupos no conectores para un protocolo de solo hibridacion. R1 y R2 pueden ser del tipo general XR, en la que X es un grupo de enlace y R es un grupo funcional.
Las construcciones de sustrato son reactivos usados para el ensamblaje dependiente de molde de una hebra hija, una composicion intermedia para producir Xpandomeros. La Figura 18B muestra la hebra hija de duplex, un hetero- copolfmero con subunidades de repetidon (mostradas en corchetes). Se muestran esqueleto primario de la hebra hija (~P1-P2~) y hebra molde diana (-p1-p2-) como un duplex (185). Cada subunidad de la hebra hija es un motivo de repeticion que comprende un miembro de sonda y un miembro de anclaje. Los motivos tienen variabilidad espedfica de especie, indicada aqu por el supermdice a. Cada subunidad particular en la hebra hija se selecciona de una biblioteca de motivos por un proceso dirigido por molde y su sonda se une a una secuencia correspondiente de nucleotidos complementarios sobre la hebra molde. De esta forma, la secuencia de residuos de nucleobase de las sondas forma una copia complementaria contigua de la hebra molde diana.
Cada tilde (~) indica un enlace selectivamente escindible. El enlace interno entre los restos P1 y P2 de un miembro de sonda no son enlaces selectivamente escindibles, pero los enlaces inter-sonda (entre subunidades) son necesariamente selectivamente escindibles segun se requiera para expandir los anclajes y el Xpandomero. En una realizacion, no se forma enlace directo entre las sondas de subunidades separadas, eliminandose asf la necesidad de escision selectiva posterior.
La hebra hija esta compuesta por el precursor Xpandomero llamado el “Xpandomero limitado” que esta adicionalmente compuesto de anclajes en la “configuracion limitada”. Cuando los anclajes se convierten en su “configuracion expandida”, el Xpandomero limitado se convierte en el producto de Xpandomero. Los anclajes estan limitados por los enlaces % formados por la conexion con los miembros de sonda de subunidades adyacentes y, opcionalmente, los enlaces intra-anclaje si todavfa estan presentes. El enlace % une el miembro de anclaje de una primera subunidad con el extremo confinado de una segunda subunidad adyacente y se forma enlazando los grupos conectores colocados, 8 de la primera subunidad y e de la segunda subunidad.
Puede observarse que la hebra hija tiene dos esqueletos, un “esqueleto primario” y el esqueleto del “Xpandomero limitado”. El esqueleto primario esta compuesto por los sustratos de sonda contiguamente confinados. El “esqueleto
5
10
15
20
25
30
35
40
45
50
55
de Xpandomero limitado” evita el enlace selectivamente escindible entre los sustratos de subunidad y se forma por restos de esqueleto enlazados por enlace %, siendo cada resto de esqueleto un enlace lineal de anclaje, a P2, a P1, enlazando cada enlace % P1 al anclaje del siguiente resto de esqueleto. Puede observarse que el esqueleto de Xpandomero limitado conecta o forma un bucle sobre los enlaces selectivamente escindibles del esqueleto primario, y seguira covalentemente intacto cuando estos enlaces selectivamente escindibles se escindan y el esqueleto primario se fragmente.
En la Figura 18B, los grupos conectores 8 y e se han reticulado y ahora forman un enlace % intra-subunidad. Despues de formar el enlace %, el enlace intra-anclaje puede romperse, aunque se muestra aqrn intacto (lmea de puntos en el sustrato). Generalmente, la formacion del enlace % depende de la proximidad del grupo conector 8 sobre la primera subunidad y la posicion del grupo conector e de una segunda subunidad confinada, de manera que esten colocados y se pongan en contacto durante o despues del ensamblaje dirigido por molde de construcciones de sustrato.
En otras realizaciones, la reticulacion depende solo de la hibridacion con el molde para juntar los dos grupos conectores. En otras realizaciones mas, el enlace % va precedido por acoplamiento enzimatico de los miembros de sonda P a lo largo del esqueleto primario, con formacion de enlaces fosfodiester entre sondas adyacentes. En la estructura mostrada aqrn, el esqueleto primario de la hebra hija se ha formado, y los enlaces inter-sustratos se representan por una tilde (~) para indicar que son selectivamente escindibles. Despues de disociar o degradar la hebra molde diana, escindiendo los enlaces selectivamente escindibles (que incluyen los enlaces intra-anclaje), el Xpandomero limitado se libera y se convierte en el producto de Xpandomero.
La Figura 18C es una representacion del producto de Xpandomero de clase II despues de la disociacion de la hebra molde y despues de la escision de los enlaces selectivamente escindibles (incluyendo aquellos en el esqueleto primario y, si no se han escindido ya, los enlaces intra-anclaje). Metodos para la disociacion de la hebra molde incluyen desnaturalizacion por calor, o digestion selectiva con una nucleasa, o degradacion qmmica. La hebra del producto de Xpandomero contiene una pluralidad de subunidades k, en la que k indica la subunidad kn en una cadena de m subunidades que constituyen la hebra hija, en la que k = 1, 2, 3 a m, en la que m>3, y generalmente m>20, y preferentemente m>50, y mas preferencialmente m>1000. Cada subunidad esta formada de un anclaje, y restos de sonda P1 y P2. El anclaje, T (l8l), se observa en su configuracion expandida y se estira a su longitud entre P2 y P1 de subunidades adyacentes. Cada subunidad, un motivo de subunidad a, contiene informacion genetica espedfica de especie establecida por el ensamblaje dirigido por molde del producto intermedio de Xpandomero (hebra hija).
La Figura 18D muestra la construccion de sustrato de la Figura 18A como modelo molecular, en la que el miembro de sonda (180), representado con cuatro residuos de nucleobase (81,82,83,84), esta unido al anclaje (181) por un enlace del primer resto terminal del anclaje (184). Un enlace intra-anclaje (85) de un segundo resto terminal esta en el extremo distal del anclaje. Un grupo conector (8) (86) tambien esta dispuesto en el segundo resto terminal y el segundo grupo conector (e) (87) correspondiente esta anclado con el extremo de la sonda opuesto al grupo conector (8). El bucle de anclaje mostrado aqrn tiene tres indicadores (78,79,80), que tambien pueden ser espedficos de especies de motivos.
La Figura 18E muestra la construccion de sustrato despues de la incorporacion en el Xpandomero producto. Las subunidades se escinden y se expanden y se enlazan por enlaces % (88), formados enlazando los grupos conectores 8 y e referidos en la Figura 18A. Una subunidad se indica por lmeas de puntos que agrupan verticalmente la subunidad de repeticion, como se representa por los corchetes en la Figura 18C adjunta. “E” de nuevo indica expansion.
En el producto de Xpandomero (Figura 18E) el esqueleto primario se ha fragmentado y no es covalentemente contiguo debido a que se ha escindido cualquier enlace directo entre las sondas de subunidades adyacentes. Mediante el proceso de escision, el Xpandomero limitado se libera para convertirse en el producto de Xpandomero. Los miembros de anclaje que estuvieron anteriormente en la configuracion limitada estan ahora en la configuracion expandida, sirviendo asf para estirar linealmente la informacion de secuencias de la diana molde. La expansion de los anclajes reduce la densidad lineal de la informacion de secuencias a lo largo del Xpandomero y proporciona una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion y descodificacion de la secuencia molde.
Aunque el anclaje se representa como una construccion de indicador con tres grupos indicadores, diversas construcciones de indicador pueden estar presentes sobre el anclaje, y pueden comprender indicadores individuales que identifican constituyentes de sonda, indicadores individuales que identifican especies de sondas, codigos de barras moleculares que identifican las especies de sondas, o el anclaje puede ser un polfmero desnudo. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
Las construcciones oligomericas de clase III, ilustradas en las Figuras 19A a 19E, sin isomeros con las construcciones de clase II tratadas anteriormente. No se incluye descripcion adicional debido a que la descripcion de
5
10
15
20
25
30
35
40
45
50
55
la clase II es adecuada para entender esta clase.
Esta clase puede servir para enfatizar que todas las clases pueden reflejarse en la aplicacion de imagen especular (es dedr, intercambio de los grupos R1 y R2). Ademas, esto sirve para ilustrar que las clases descritas no pretenden ser completas, sino que reflejan algunas de las muchas disposiciones posibles que engloba la presente invencion.
La Figura 20 representa un esquema condensado de un metodo de preparacion de una primera realizacion de un Xpandomero de clase II; el metodo ilustra la preparacion y uso de sustratos y productos mostrado en las Figuras 18D y 18E. El metodo se realiza con qmmicas en fase solida. Los metodos de alivio de la estructura secundaria en el molde se tratan en una seccion posterior. Condiciones adecuadas adaptadas para la hibridacion y acoplamiento qrnmico son muy conocidas en la tecnica y las condiciones pueden ser facilmente optimizadas por un experto en este campo.
La etapa I de la Figura 20 muestra una mezcla de reaccion que contiene un molde inmovilizado (200) y una biblioteca de reactivos de sustrato (201). Se observa que las construcciones de sustrato se unen espedficamente al molde en una hibridacion dirigida por molde. Las condiciones se ajustan para optimizar la complementariedad y fidelidad de la union. Como se muestra en la insercion de la figura (vease la Figura 20a), cada construccion de sustrato confinada pone en proximidad el grupo funcional 8 (202) sobre el aspecto distal del anclaje, mostrado aqu unido con el tallo del anclaje por una reticulacion intra-anclaje (203), representada por los triangulos adyacentes, y el grupo funcional e (204) del miembro de sonda confinado.
En la etapa II, se produce una reaccion de reticulacion entre extremos proximalmente confinados hibridados de los miembros de sonda que implican a los dos grupos funcionales 8 y e, formando asf un enlace % anclaje a sonda inter- subunidad (205), representado como un ovalo abierto, como se muestra en la insercion de la figura (vease la Figura 20b). La hibridacion se produce en paralelo en diversos sitios sobre el molde, promiscuamente, y el acoplamiento qrnmico puede producirse en un ciclo de hibridacion (etapa III), fusion rigurosa y/o lavado (etapa IV), y acoplamiento qrnmico (etapa V). El ciclo puede repetirse para aumentar el numero de subunidades contiguas ensambladas para formar el producto intermedio de Xpandomero. La etapa VI ilustra un producto intermedio de Xpandomero completado con dos hebras de producto contiguas de longitud variable. Puede emplearse un metodo similar con los Xpandomeros de clase III.
La Figura 21 ilustra un metodo de ligacion procesiva de los sustratos de clase II sobre un molde inmovilizado. La etapa I muestra un cebador (210) que se hibrida con el molde (212), el cebador adaptado con un grupo funcional
qmmicamente reactivo e mostrado en la insercion de la figura como (214) (vease la Figura 21a). Una mezcla de
reaccion que contiene sustratos de clase II (216) se anade entonces a la etapa II. Como se muestra en la insercion de la figura (Figura 21a), estas construcciones de sustrato tienen reactividad 8 (217) y e (214) en extremos opuestos del miembro de sonda-anclaje. Se observa que una primera construccion de sustrato se une espedficamente al molde en una hibridacion dirigida por molde. Las condiciones se ajustan para optimizar la complementariedad y
fidelidad de la union. Entonces se usa una ligasa para enlazar covalentemente la primera sonda al cebador (etapa
II).
En las etapas III y IV, el proceso de hibridacion y ligacion procesivo de construcciones de sustrato continua con el fin de construir el producto intermedio de Xpandomero mostrado formado en la etapa IV. Tras esto, en la etapa V, la reticulacion se realiza entre los grupos 8 (217) y e (214) (vease la Figura 21b), produciendo un enlace % como se representa en la Figura 21c como (219). Como se muestra en las inserciones de figuras (Figura 21b y 21c), el grupo funcional 8 (217) sobre el anclaje esta limitado por una reticulacion intra-anclaje (211), representada por los triangulos adyacentes, hasta que se forma el enlace %. El producto intermedio de Xpandomero completado se disocia opcionalmente de la hebra molde y se escinde para formar un producto de Xpandomero adecuado para la secuenciacion. Puede emplearse un metodo similar con los Xpandomeros de clase III. Este metodo tambien puede adaptarse para su uso con una polimerasa sustituyendo construcciones de sustrato de trifosfato.
Construcciones oligomericas de clase IV y V
Con referencia a las Figuras 22A a 22E, se describen construcciones oligomericas de clase IV en mas detalle.
Las Figuras 22A a 22C se leen de izquierda a derecha, mostrando primero la construccion de sonda-sustrato (precursores de Xsonda o Xmero de Xpandomero), luego la hebra hija del duplex intermedia en el centro, y a la derecha el producto de Xpandomero preparado para la secuenciacion.
La Figura 22A muestra una construccion de sustrato de clase IV que tiene miembro de sonda oligomerico (229) con restos de sonda P1 y P2 que se unen al anclaje, T (220). El anclaje T esta unido a P1 y P2 por enlace apropiado con el primer y segundo restos terminales del anclaje, respectivamente. Los grupos conectores e del primer resto terminal y 8 del segundo resto terminal estan posicionados cerca de los extremos R1 y R2 de la sonda, respectivamente (en una realizacion alternativa, las posiciones de los grupos funcionales pueden estar invertidas). Bajo condiciones controladas, los grupos funcionales 8 (222) y s (221) reaccionaran para formar un enlace % como se muestra en la Figura 22B. Estos grupos de enlace estan posicionados en la construccion de sustrato para limitar estas reacciones de enlace con construcciones de sustrato confinadas adyacentes. La construccion de sustrato
5
10
15
20
25
30
35
40
45
50
55
preferencialmente no se enlaza consigo misma. Qmmicas de enlace y de proteccion/desproteccion adecuadas para 8, e, y % se detallan en la descripcion general de construcciones oligomericas.
R1 y R2 son grupos terminales configurados segun convenga para el protocolo de smtesis en el que se usa la construccion de sustrato. Por ejemplo, R1 = 5'-fosfato y R2 = 3'-OH, encontranan uso en un protocolo de ligacion, y R1 = 5'-trifosfato y R2 = 3'-OH para un protocolo de polimerasa I. Opcionalmente, R2 puede configurarse con un grupo de bloqueo reversible para la adicion dclica de un unico sustrato. Alternativamente, R1 y R2 pueden configurarse con los grupos conectores terminales para el acoplamiento qmmico o con grupos no conectores para un protocolo de solo hibridacion. R1 y R2 pueden ser del tipo general XR, en la que X es un grupo de enlace y R es un grupo funcional.
Las construcciones de sustrato son reactivos usados para el ensamblaje dirigido por molde de una hebra hija, una composicion intermedia para producir Xpandomeros. La Figura 22B muestra la hebra hija de duplex, un hetero- copolfmero con subunidades de repetition (mostradas en corchetes). Se muestran esqueleto primario de la hebra hija (-P1~P2-) y hebra molde diana (-P1-P2-) como un duplex (228). Cada subunidad de la hebra hija es un motivo de repeticion que comprende un miembro de sonda y un miembro de anclaje. Los motivos tienen variabilidad espedfica de especie, indicada aqu por el supermdice a. Cada subunidad particular en la hebra hija se selecciona de una biblioteca de motivos por un proceso dirigido por molde y su sonda se une a una secuencia correspondiente de nucleotidos complementarios sobre la hebra molde. De esta forma, la secuencia de residuos de nucleobase de las sondas forma una copia complementaria contigua de la hebra molde diana.
La tilde (~) indica un enlace selectivamente escindible. El enlace interno entre los restos P1 y P2 de un miembro de sonda es necesariamente selectivamente escindible segun se requiera para expandir los anclajes y el Xpandomero. En una realizacion, no se forma enlace directo entre las sondas de subunidades separadas.
La hebra hija esta compuesta por un precursor de Xpandomero llamado el “Xpandomero limitado” que esta adicionalmente compuesto de anclajes en la “configuracion limitada”. Cuando los anclajes se convierten en su “configuracion expandida”, como se muestra en la Figura 22C, el Xpandomero limitado se convierte en el producto de Xpandomero. Los anclajes estan limitados por los enlaces % formados por conexion con el miembro de anclaje de subunidades adyacentes y por los enlaces de sonda. El enlace % une el miembro de anclaje de una primera subunidad con el anclaje de una segunda subunidad adyacente y se forma enlazando los grupos conectores colocados, 8 de la primera subunidad y e de la segunda subunidad.
Puede observarse que la hebra hija tiene dos esqueletos, un “esqueleto primario” y el esqueleto del “esqueleto de Xpandomero limitado”. El esqueleto primario esta compuesto por los sustratos de sonda contiguamente confinados. El “esqueleto de Xpandomero limitado” es el enlace lineal de los anclajes en cada subunidad enlazados juntos por los enlaces % que evitan los sustratos de sonda de subunidad. El enlace % resulta de una reaccion del grupo funcional e de una primera subunidad con el grupo funcional 8 de una segunda subunidad confinada. Puede observarse que el esqueleto de Xpandomero limitado conecta o forma un bucle sobre los enlaces selectivamente escindibles del esqueleto primario, y seguira covalentemente intacto cuando estos enlaces selectivamente escindibles se escindan y el esqueleto primario se fragmente.
En la Figura 22B, los grupos conectores 8 y e se han reticulado y ahora forman un enlace % intra-subunidades. Generalmente, la formacion del enlace % depende de la colocacion del grupo conector 8, en la primera subunidad, y el grupo conector e, de una segunda subunidad confinada, de manera que se pongan en contacto durante o despues del ensamblaje dirigido por molde de construcciones de sustrato.
En otras realizaciones, la reticulacion del enlace % depende solo de la hibridacion con el molde para juntar los dos grupos conectores. En otras realizaciones mas, la formacion del enlace % va precedida del acoplamiento enzimatico de los miembros de sonda P a lo largo del esqueleto primario con enlaces fosfodiester entre sondas adyacentes. En la estructura mostrada en la Figura 22B, el esqueleto primario de la hebra hija se ha formado, y el enlace entre los restos de sonda se representa por una tilde (~) para indicar que es selectivamente escindible. Despues de disociar o degradar la hebra molde diana, escindiendo los enlaces selectivamente escindibles, el Xpandomero limitado se libera y se convierte en el producto de Xpandomero como se muestra en la Figura 22C.
A este respecto, la Figura 22C es una representacion del producto de Xpandomero de clase IV despues de la disociacion de la hebra molde y despues de la escision de los enlaces selectivamente escindibles del esqueleto primario. Metodos para la disociacion de la hebra molde incluyen desnaturalizacion por calor, o digestion selectiva con una nucleasa, o degradacion qmmica. La hebra del producto de Xpandomero contiene una pluralidad de subunidades k, en la que k indica la subunidad kn en una cadena de m subunidades que constituyen la hebra hija, en la que m>3, y generalmente m>20, y preferentemente m>50, y mas preferencialmente m>100o. Cada subunidad esta formada de un anclaje (220), y restos de sonda laterales P1 y P2. El anclaje, T, se observa en su configuracion expandida y se estira a su longitud entre subunidades adyacentes. Cada subunidad, un motivo de subunidad a, contiene informacion genetica espedfica de especie establecida por el ensamblaje dirigido por molde del producto intermedio de Xpandomero (hebra hija).
5
10
15
20
25
30
35
40
45
50
55
La Figura 22D muestra la construccion de sustrato de la Figura 22A como modelo molecular, en la que el miembro de sonda, representado con cuatro residuos de nucleobase (drculos blancos), esta unido al anclaje por un enlace del primer resto terminal del anclaje. El grupo conector (221), mostrado como e en la Figura 22A, tambien es del primer resto terminal del anclaje. Un grupo conector (222), mostrad como 8 en la Figura 22A, esta dispuesto en un segundo resto terminal en el extremo distal del anclaje (220). El bucle de anclaje mostrado aqrn tiene tres indicadores (800,801,802), que tambien pueden ser espedficos de especies de motivos. Un enlace selectivamente escindible, mostrado como una “V” (225), se localiza dentro del miembro de sonda (229).
La Figura 22E muestra la construccion de sustrato despues de la incorporacion en el Xpandomero producto. Las subunidades se escinden, mostradas como lmeas (225a,225b), y se expanden y se enlazan por enlaces % (223,224), formados enlazando los grupos conectores 8 y e referidos en la Figura 22A. Una subunidad se indica por lmeas de puntos que agrupan verticalmente la subunidad de repeticion, como se representa por los corchetes en la Figura 22C adjunta.
En el producto de Xpandomero de la Figura 22E, el esqueleto primario se ha fragmentado y no es covalentemente contiguo debido a que se ha escindido cualquier enlace directo entre las sondas de subunidades adyacentes. Mediante el proceso de escision, el Xpandomero limitado se libera para convertirse en el producto de Xpandomero. Los miembros de anclaje que estuvieron anteriormente en la configuracion limitada estan ahora en la configuracion expandida, sirviendo asf para estirar linealmente la informacion de secuencias de la diana molde. La expansion de los anclajes reduce la densidad lineal de la informacion de secuencias a lo largo del Xpandomero y proporciona una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion y descodificacion de la secuencia molde.
Aunque el anclaje se representa como una construccion de indicador con tres grupos indicadores, diversas construcciones de indicador pueden estar presentes sobre el anclaje, y pueden comprender indicadores individuales que identifican constituyentes de sonda, indicadores individuales que identifican especies de sondas, codigos de barras moleculares que identifican las especies de sondas, o el anclaje puede ser un polfmero desnudo. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
Las construcciones de sustrato de clase V son similares a las construcciones de clase IV, siendo la diferencia primaria la posicion de los conectores escindibles. Las Figuras 23A a 23C se leen de izquierda a derecha, mostrando primero la construccion de sonda-sustrato (precursores de Xsonda o Xmero de Xpandomero), luego la hebra hija del duplex intermedia en el centro, y a la derecha el producto de Xpandomero preparado para la secuenciacion.
La Figura 23A ilustra una construccion de sustrato de clase V que tiene primer y segundo restos terminales de anclaje T (239) unidos con dos enlaces terminales selectivamente escindibles (234, 238) (representados como dos “-’’verticales). Estos enlaces escindibles se unen entonces al primer y segundo restos de sonda, P1 y P2, de un miembro de sonda oligomerico (235). Los grupos conectores e (230) y 8 (231) de dicho primer y segundo restos terminales estan posicionados cerca de los extremos R1 y R2 de la sonda (de nuevo, las posiciones de estos grupos funcionales pueden estar invertidas). Bajo condiciones controladas, los grupos funcionales 8 y e se hacen reaccionar para formar un enlace %. Estos grupos de enlace estan posicionados en la construccion de sustrato para limitar estas reacciones de enlace con construcciones de sustrato confinadas adyacentes. La construccion de sustrato preferencialmente no se enlaza consigo misma. Qmmicas de enlace y de proteccion/desproteccion adecuadas para 8, e, y % se detallan en la descripcion general de construcciones oligomericas.
R1 y R2 son grupos terminales configurados segun convenga para el protocolo de smtesis en el que se usa la construccion de sustrato. Por ejemplo, R1 = 5'-fosfato y R2 = 3'-OH, encontranan uso en un protocolo de ligacion como se encuentra en Xsondas, y R1 = 5'-trifosfato y R2 = 3'-OH para un protocolo de polimerasa I como se encuentra en Xmeros. Opcionalmente, R2 puede configurarse con un grupo de bloqueo reversible para la adicion dclica de un unico sustrato. Alternativamente, R1 y R2 pueden configurarse con los grupos conectores terminales para el acoplamiento qmmico o con grupos no conectores para un protocolo de solo hibridacion. R1 y R2 pueden ser del tipo general XR, en la que X es un grupo de enlace y R es un grupo funcional.
Las construcciones de sustrato son reactivos usados para el ensamblaje dirigido por molde de una hebra hija, una composicion intermedia para producir Xpandomeros. La Figura 23B muestra la hebra hija de duplex, un hetero- copolfmero con subunidades de repeticion (mostradas en corchetes). Se muestran esqueleto primario de la hebra hija (-P1-P2-) y hebra molde diana (-P1-P2-) como un duplex (236). Cada subunidad de la hebra hija es un motivo de repeticion que comprende un miembro de sonda y un miembro de anclaje. Los motivos tienen variabilidad espedfica de especie, indicada aqrn por el supermdice a. Cada subunidad particular en la hebra hija se selecciona de una biblioteca de motivos por un proceso dirigido por molde y su sonda se une a una secuencia correspondiente de nucleotidos complementarios sobre la hebra molde. De esta forma, la secuencia de residuos de nucleobase de las sondas forma una copia complementaria contigua de la hebra molde diana.
La tilde (~) indica un enlace selectivamente escindible. Los enlaces conectan restos P1 y P2 de un miembro de sonda con el anclaje y son necesariamente selectivamente escindibles segun se requiera para expandir los anclajes y el
5
10
15
20
25
30
35
40
45
50
55
Xpandomero. En una realizacion, no se forma enlace directo entre las sondas de subunidades separadas.
La hebra hija esta compuesta por un precursor de Xpandomero llamado el “Xpandomero limitado” que esta adicionalmente compuesto de anclajes en la “configuracion limitada”. Cuando los anclajes se convierten en su “configuracion expandida”, como se muestra en la Figura 23C, el Xpandomero limitado se convierte en el producto de Xpandomero. Los anclajes estan limitados por los enlaces % formados por conexion con los miembros de anclaje de subunidades adyacentes y por los enlaces selectivamente escindibles (234,238). El enlace % une el miembro de anclaje de una primera subunidad con el anclaje de una segunda subunidad adyacente y se forma enlazando los grupos conectores colocados, 8 de la primera subunidad y e de la segunda subunidad.
Puede observarse que la hebra hija tiene dos esqueletos, un “esqueleto primario” y el esqueleto del “esqueleto de Xpandomero limitado”. El esqueleto primario esta compuesto por los sustratos de sonda contiguamente confinados. El “esqueleto de Xpandomero limitado” es el enlace lineal de los anclajes en cada subunidad enlazados juntos por los enlaces % que evitan los sustratos de sonda de subunidad. El enlace % resulta de una reaccion del grupo funcional e de una primera subunidad con el grupo funcional 8 de una segunda subunidad confinada. Puede observarse que el esqueleto de Xpandomero limitado conecta o forma un bucle sobre los enlaces selectivamente escindibles que conectan con el esqueleto primario, y seguira covalentemente intacto cuando estos enlaces selectivamente escindibles se escindan y el esqueleto primario se disocie o se fragmente de otro modo.
En la Figura 23B, los grupos conectores 8 y e se han reticulado y ahora forman un enlace % intra-subunidades. Generalmente, la formacion del enlace % depende de la colocacion del grupo conector 8, en la primera subunidad, y el grupo conector e, de una segunda subunidad confinada, de manera que se pongan en contacto durante o despues del ensamblaje dirigido por molde de construcciones de sustrato.
En algunos protocolos, la reaccion de reticulacion depende solo de la hibridacion con el molde para juntar los dos grupos reactivos. En otros protocolos, el enlace va precedido del acoplamiento enzimatico de los miembros de sonda, con formacion de enlaces fosfodiester entre sondas adyacentes. En la estructura mostrada en la Figura 23B, el esqueleto primario de la hebra hija se ha formado. El anclaje, ahora unido a subunidades adyacentes por enlaces %, y comprende el esqueleto de Xpandomero limitado. Tras la escision de los enlaces selectivamente escindibles (~), el Xpandomero limitado se separa del esqueleto primario para convertirse en el producto de Xpandomero, y su anclajes ahora sin limitar se expanden linealmente a su longitud completa como se muestra en la Figura 23C.
A este respecto, la Figura 23C es una representacion del producto de Xpandomero de clase V despues de la escision de los enlaces selectivamente escindibles que disocia el esqueleto primario. La hebra del producto de Xpandomero contiene una pluralidad de subunidades k, en la que k indica la subunidad kn en una cadena de m subunidades que constituyen la hebra hija, en la que m>3, y generalmente m>20, y preferentemente m>50, y mas preferencialmente m>1000. Cada subunidad esta formada de un anclaje, T (239), como se observa en su configuracion expandida y se estira a su longitud entre subunidades adyacentes. Cada subunidad, un motivo de subunidad a, contiene informacion genetica espedfica de especie establecida por el ensamblaje dirigido por molde del producto intermedio de Xpandomero (hebra hija).
La Figura 23D muestra la construccion de sustrato de la Figura 23A como modelo molecular, en la que el miembro de sonda (235), representado con cuatro residuos de nucleobase (drculos blancos), esta unido al primer y segundo restos terminales del anclaje por dos enlaces escindibles (234,238). El grupo conector (232), mostrado como e en la Figura 23A, es del primer resto terminal del anclaje y el grupo conector (233), mostrado como 8 en la Figura 23A, es del segundo resto terminal del anclaje. El bucle de anclaje mostrado aqrn tiene tres indicadores (237a, 237b, 237c), que tambien pueden ser espedficos de especies de motivos.
La Figura 23E muestra la construccion de sustrato despues de la incorporacion en el Xpandomero producto. Las subunidades se escinden (234a, 234b, 238a, 238b) y se expanden y se enlazan por enlaces % (249,248), formados enlazando los grupos conectores 8 y e referidos en la Figura 23A. Una subunidad se indica por lmeas de puntos que agrupan verticalmente la subunidad de repeticion, como se representa por los corchetes en la Figura 23C adjunta.
En el producto de Xpandomero de la Figura 23E, el esqueleto primario (235) se ha escindido (disociado). Mediante el proceso de escision, el Xpandomero limitado se libera para convertirse en el producto de Xpandomero. Los miembros de anclaje que estuvieron anteriormente en la configuracion limitada estan ahora en la configuracion expandida, sirviendo asf para estirar linealmente la informacion de secuencias de la diana molde. La expansion de los anclajes reduce la densidad lineal de la informacion de secuencias a lo largo del Xpandomero y proporciona una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion y descodificacion de la secuencia molde.
Aunque el anclaje se representa como una construccion de indicador con tres grupos indicadores, diversas construcciones de indicador pueden estar presentes sobre el anclaje, y pueden comprender indicadores individuales que identifican constituyentes de sonda, indicadores individuales que identifican especies de sondas, codigos de barras moleculares que identifican las especies de sondas, o el anclaje puede ser un polfmero desnudo. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
5
10
15
20
25
30
35
40
45
50
55
60
La preparacion y uso de un Xpandomero de clase V se ilustra en la Figura 24. En el establecimiento para la smtesis en la etapa I, un molde monocatenario (245) se pone en contacto y se hibrida con cebador de secuenciacion (246). El primer ensamblaje (247) se pone entonces en contacto con una biblioteca de construcciones de sustrato de clase V y una polimerasa (etapa II). En la etapa III, los sustratos se han anadido procesivamente en una polimerizacion dirigida por molde. En la etapa IV, la polimerizacion del esqueleto primario de la hebra hija esta completa y los grupos funcionales reactivos de los brazos laterales del anclaje confinado se reticulan, formando los enlaces % anclaje a anclaje. Finalmente, en la etapa V, los enlaces escindibles en los tallos de los bucles de anclaje se cortan, liberando el esqueleto anclaje a anclaje sintetico de la hebra hija oligomerica y molde. Este Xpandomero (249) esta asf enteramente construido de enlaces de anclaje y se muestra que se expande espontaneamente a medida que se aleja del resto del producto intermedio sintetico. Aqm, la informacion genetica correspondiente a la secuencia de polinucleotidos diana esta codificada en las subunidades contiguas de los anclajes.
Preparacion y uso de Xmeros
Las realizaciones de clase I incluyen Xsondas y Xmeros. Las Xsondas son monofosfatos, aunque los Xmeros son trifosfatos. Los “Xmeros” son construcciones de sustrato de trifosfato de oligonucleotidos expansibles que pueden polimerizarse en una smtesis dirigida por molde dependiente de enzima de un Xpandomero. Al igual que las Xsondas, las construcciones de sustrato de Xmero tienen una forma de “sonda-bucle” caractenstica como se ilustra en las Figuras 10A y 10C, en las que R1 es 5'-trifosfato y R2 es 3'-OH. Observese que las construcciones de sustrato son trifosfatos de oligonucleobase o trifosfatos analogos a oligomeros, pero los miembros de sonda (es decir, el oligomero) se han modificado con una construccion de anclaje y un enlace selectivamente escindible entre los enlaces terminales del anclaje como se muestra en la Figura 10D, cuya funcion se ilustra adicionalmente en la Figura 10E.
Las ADN y ARN polimerasas pueden incorporar oligonucleotidos de trifosfato de dinucleotido, trinucleotido y tetranucleotido con un nivel de eficiencia y fidelidad en un proceso procesivo dependiente de cebador como se desvela en la patente de EE.UU. N°. 7.060.440 a Kless. Los trifosfatos de oligonucleotido modificados en el anclaje de longitud n (n = 2, 3, 4, o mas) pueden usarse como sustratos para la incorporacion basada por polimerasa en Xpandomeros. Enzimas adecuadas para su uso en los metodos mostrados en la Figura 16 y 17 incluyen, por ejemplo, ADN polimerasas dependientes de ADN, ARN polimerasas dependientes de ADN, ADN polimerasas dependientes de ARN, ARN polimerasas dependientes de ARN, ADN polimerasa T7, ADN polimerasa T3, ADN polimerasa T4, ARN polimerasa T7, ARN polimerasa T3, ARN polimerasa SP6, ADN polimerasa I, fragmento de Klenow, ADN polimerasa de Thermophilus aquaticus, ADN polimerasa Tth, ADN polimerasa VentR® (New England Biolabs), ADN polimerasa Deep VentR® (New England Biolabs), fragmento grande de ADN polimerasa Bst, fragmento de Stoeffel, ADN polimerasa 9°N, ADN polimerasa 9°N, ADN Polimerasa Pfu, ADN Polimerasa Tfl, ADN polimerasa Tth, polimerasa RepliPHI Phi29, ADN polimerasa TIi, ADN polimerasa beta de eucariota, telomerasa, polimerasa Therminator™ (New England Biolabs), ADN polimerasa KOD HiFi™ (Novagen), ADN polimerasa KOD1, Q-beta replicasa, transferasa terminal, transcriptasa inversa AMV, transcriptasa inversa M-MLV, transcriptasa inversa de Phi6, transcriptasa inversa del VIH-1, polimerasas novedosas descubiertas por bioprospeccion, y las polimerasas citadas en los documentos US 2007/0048748, US 6329178, US 6602695 y uS 6395524. Estas polimerasas incluyen isoformas no mutantes, mutantes, y variantes geneticamente manipuladas.
La polimerizacion de Xmeros es un metodo de smtesis de Xpandomeros y se ilustra en la Figura 16, por ejemplo, en la que el sustrato 2mero se proporciona como un trifosfato. Debido a que los Xmeros se polimerizan procesivamente, las etapas de extension, reticulacion, activacion de extremo y de lavado de alta rigurosidad normalmente asociadas a secuenciacion dclica por metodos de smtesis se eliminan opcionalmente con este enfoque. Asf, la reaccion puede realizarse en disolucion. La smtesis de Xpandomeros con Xmeros tambien puede realizarse con moldes inmovilizados, como se ilustra en la Figura 17, en la que un trifosfato Xmero 4mero se polimeriza procesivamente en una smtesis dirigida por molde dependiente de un cebador.
Puede emplearse una variedad de metodos para la smtesis robusta de Xmeros de 5'-trifosfato. Como se describe por Burgess y Cook (“Synthesis of Nucleoside Triphosphates”, Chem. Rev. 100(6):2047-2060, 2000), estos metodos incluyen (pero no se limitan a) reacciones que usan fosforamiditos de nucleosido, smtesis mediante el ataque nucleofilo de pirofosfato sobre monofosfatos de nucleosido activados, smtesis mediante el ataque nucleofilo de fosfato sobre pirofosfato de nucleosido activado, smtesis mediante ataque nucleofilo de difosfato sobre fosfato sintona activado, smtesis que implica fosfitos o fosforamiditos activados derivados de nucleosidos, smtesis que implica el desplazamiento directo de grupos salientes 5'-O- por nucleofilos de trifosfato, y metodos biocataltticos. Un metodo representativo para producir sustratos de dinucleotido compatibles con polimerasa usa N-metilimidazol para activar el grupo 5'-monofosfato; la posterior reaccion con pirofosfato (sal de tributilamonio) produce el trifosfato (Abramova et al., “A facile and effective synthesis of dinucleotide 5'-triphosphates”, Bioorganic and Med Chem 15, 6549-6555, 2007).
Como se trata mas abajo en mas detalle, la construccion de anclaje de Xmero esta relacionada en diseno, composicion y enlace con la del anclaje usado para las Xsondas. En muchas realizaciones, la informacion genetica esta codificada sobre el anclaje y, por tanto, cada anclaje de cada construccion de sustrato es un anclaje espedfico de especie. La informacion codificada sobre el anclaje esta codificada con un codigo de indicador que digitaliza la informacion genetica. Por ejemplo, la codificacion binaria de cinco bits en los anclajes producina 32 codigos de
5
10
15
20
25
30
35
40
45
50
55
secuencia unicos (25). Esta estrategia puede usarse para codificar unicamente las 16 combinaciones de dos residuos de nucleobase por miembro de sonda de una biblioteca 2mera, independientemente de la orientacion del anclaje. Similar a la codificacion de Xsondas, puede considerarse una variedad de estrategias de funcionalizacion y de marcado para Xmeros, que incluye (pero no se limita a): dendnmeros funcionalizados, poUmeros, poKmeros ramificados, nanopartfculas y nanocristales como parte del andamiaje del anclaje, ademas de qmmicas de indicador y senales de indicador - que van a detectarse con la tecnologfa de deteccion apropiada. Las marcas espedficas de base pueden introducirse (mediante la union al anclaje) tanto antes de como despues de la polimerizacion del Xmero, por enlace covalente o por dirigido por afinidad.
Diseno y sintesis de Xsondas y Xmeros
Una vision general de estrategias sinteticas y de escision se presentan a continuacion, empezando con los oligomeros de sonda con enlaces selectivamente escindibles, seguido de las anclaje y construcciones de anclaje de indicador.
Un objetivo de un metodo de SBX basado en Xsondas o Xmeros es ensamblar una replica del acido nucleico diana tan completa y eficazmente como sea posible por una sintesis dirigida por molde, generalmente un proceso o combinacion de procesos seleccionados de hibridacion, ligacion, polimerizacion o reticulacion qrnmica de composiciones de precursor adecuadas, llamadas aqu “sustratos”. Los sustratos de Xsondas y Xmeros se suministran como bibliotecas de reactivos (por ejemplo, como partes de kits para la secuenciacion) para este fin. Las bibliotecas son generalmente de naturaleza combinatoria y contienen miembros de sonda seleccionados para unirse espedficamente a cualquiera o todas de las secuencias complementarias, tales como se encontranan en un polinucleotido diana. El numero de sondas requeridas en una biblioteca para este fin es una funcion del tamano de la sonda. Puede considerarse que cada sonda es un fragmento de secuencia, y debe estar presente suficiente variedad de miembros de sonda para formar una copia contigua de la secuencia contigua de fragmentos de secuencias complementarias del polinucleotido diana. Para sondas en las que cada oligomero es un dfmero, existen 16 combinaciones de especies posibles de A, T, C y G. Para sondas en las que cada oligomero es un tnmero, entonces existen 64 combinaciones de especies posibles de A, T, C y G, etc. Cuando se secuencian fragmentos genomicos al azar, es probable que todas aquellas especies sean requeridas en una biblioteca de reactivos.
Las Xsondas y Xmeros son construcciones oligomericas de sustrato que se dividen en cinco clases funcionales diferentes. Las construcciones oligomericas de sustrato tienen dos componentes funcionales distintos: una oligonucleobase modificada o miembro de “sonda”, y un miembro de anclaje (“T”). La sonda esta unida al miembro de anclaje por una construccion de “sonda-bucle”, en la que el bucle de anclaje es un precursor del miembro de anclaje linealizado del Xpandomero de producto final. Cada anclaje T puede codificarse con indicadores (comunmente denominados “etiquetas” o “marcas”), o combinaciones de los mismos, que identifican unicamente la secuencia de sonda con la que esta anclado. De esta forma, la informacion de secuencias del Xpandomero ensamblado se detecta mas facilmente.
El oligomero es la porcion de sonda de la Xsonda. La sonda es una oligonucleobase modificada que tiene una cadena de x desoxirribonucleotidos, ribonucleotidos, o mas generalmente, residuos de nucleobase (en la que x puede ser 2, 3, 4, 5, 6, o mas). En estas discusiones, una sonda con 2, 3, 4, 5 o 6 residuos de nucleobase de longitud puede denominarse una 2mera, 3mera, 4mera, 5mera, o 6mera, respectivamente.
Los reactivos de construcciones de sustrato pueden sintetizarse con un esqueleto 5'-3' fosfodiester de oligonucleotido, cuyo oligomero tiene los nucleotidos A, T, G y C (estructuras mostradas en la tabla de la Figura 25), u otros analogos de acidos nucleicos hibridables tales como aquellos que tienen un esqueleto de peptido, esqueleto de fosfono-peptido, esqueleto de serina, esqueleto de hidroxiprolina, esqueleto mixto de peptido-fosfono-peptido, esqueleto mixto de peptido-hidroxiprolina, esqueleto mixto de hidroxiprolina-fosfono-peptido, esqueleto mixto de serina-fosfono-peptido, esqueleto de treosa, esqueleto de glicol, esqueleto de morfolino, y similares, como se conoce en la tecnica. Los oligomeros de acido desoxirribonucleico y oligomeros de acido ribonucleico, y oligomeros mixtos de los dos, tambien pueden usarse como sondas. Otras bases tambien pueden estar sustituidas, tales como uracilo por timidina, e inosina como base degenerada. Tambien pueden usarse residuos fragmentados de nucleobases que tienen complementariedad.
Una recitacion mas completa de bases degeneradas e inestables conocidas en la tecnica incluye, pero no se limita a, xantina, hipoxantina, o un derivado heterodclico, analogo, o tautomero de xantina e hipoxantina, 8-azapurina, purinas sustituidas en la posicion 8 con metilo o bromo, 9-oxo-N6-metiladenina, 2-aminoadenina, 7-deazaxantina, 7- deazaguanina, 7-deaza-adenina, N4-etanocitosina, 2,6-diaminopurina, N6-etano-2,6-diaminopurina, 5-metilcitosina, 5-alquinil (C3-C6)-citosina, 5-fluorouracilo, 5-bromouracilo, tiouracilo, 2-hidroxi-5-metil-4-triazolopiridina, isocitosina, pseudoisocitosina, isoguanina, 7,8-dimetilaloxazina, 6-dihidrotimina, 5,6-dihidrouracilo, 4-metil-indol, etenoadenina y las nucleobases descritas en las patentes de EE.UU. N° 5.432.272 y 6.150.510, PCT publicadas WO 92/002258, WO 93/10820, WO 94/22892 y Wo 94/22144, y en Fasman, Practical Handbook of Biochemistry and Molecular Biology, pp. 385-394, CRC Press, Boca Raton, lA, 1989.
Como se conoce en la tecnica, los oligomeros pueden disenarse para incluir modificadores de nucleotidos. En algunas realizaciones, estos sirven de puntos de union para el miembro de anclaje o miembros. Derivados de purina
5
10
15
20
25
30
35
40
45
50
55
60
y pirimidina adecuados para la smtesis de oligomeros derivatizados son muy conocidos en la tecnica. Dos de tales bases modificadas representativas se muestran en las Figuras 26A y 26B, en las que se representan un derivado de citosina modificado con 5-amino y un residuo de guanina modificado con 8-amino.
Como se ilustra en las Figuras 27A y 27B, tomando un oligomero 4mero como ejemplo (aqu ilustrado como 5'- monofosfato), cualesquiera dos de las cuatro posiciones de base sobre el oligomero pueden modificarse para crear puntos de union por qmmicas conocidas. Los nucleotidos modificados en los residuos de sonda 2 y 3 (sobre lados opuestos de un enlace selectivamente escindible, representado como “V”) se ilustran en la Figura 27A. Esta figura ilustra un oligomero 4mero con conectores amino unidos a citosina y guanosina del oligomero. La Figura 27B ilustra un oligomero 4mero con grupos funcionales benzaldelmdo con la citosina y guanosina del oligomero. Los detalles son ilustrativos de metodos muy conocidos en la tecnica. Para simplicidad, la mayona de las ilustraciones proporcionadas en el presente documento supondran 4meros, a menos que se indique lo contrario, pero se entiende que pueden emplearse otras bibliotecas de construcciones de sustrato o combinaciones de bibliotecas en la practica de la presente invencion.
Escision
Generalmente, las construcciones de sustrato de Xsondas y Xmero tienen enlaces selectivamente escindibles que permiten la expansion controlada del anclaje. Como se ha citado previamente, tal escision selectiva puede lograrse por cualquier numero de tecnicas conocidas para un experto en la materia, que incluyen, pero no se limitan a, escision del esqueleto de fosforotiolato con cationes metalicos, escision por acido de modificaciones del esqueleto de fosforamidato, escision selectiva por nucleasa de enlaces fosfodiester estandar usando modificaciones de fosforotioato resistentes a nucleasas para la proteccion de esqueletos, fotoescision de conectores de esqueleto modificado con nitrobencilo, y reduccion de enlaces disulfuro.
La modificacion de sondas de sustrato para incluir enlaces selectivamente escindibles se ilustran en las Figuras 28A a 28D y en las Figuras 29A a 29D. La Figura 28A muestra un ejemplo de un dfmero de Xsonda con un grupo ribosil 2'-OH susceptible a escision por ribonucleasa H en un producto intermedio de Xpandomero de duplex de aDn/ARN. El enlace es asf selectivamente escindible, siempre que el (los) otro(s) nucleotido(s) en la Xsonda sean resistentes a la escision por RNasa (por ejemplo, nucleobases de 2'-o-metil-pentosa, 2'-desoxirribosa, nucleobases de LNA “bloqueado”, y nucleobases enlazadas por glicol o peptido). Estos sitios de escision tienen otros usos, por ejemplo, un ribonucleotido en la penultima 5'-nucleobase y un adaptador proporciona un conector escindible entre el Xpandomero y un soporte inmovilizado.
La Figura 28B muestra una Xsonda con enlace fosfodiester que acopla dos nucleotidos. En esta figura, ademas de las Figuras 28A, 28C y 28D, los anclajes para conectar el enlace selectivamente escindible de la sonda se indican en (282) y (284). Este enlace es selectivamente escindible con nucleasa de judfa mungo, nucleasa S1, DNasa I, u otras DNasas, por ejemplo, si otros enlaces que unen los anclajes de subunidad juntos son resistentes a nucleasa. La smtesis de una biblioteca 2mera, por ejemplo, con un enlace de fosfato estandar entre los puntos de union del anclaje y el (los) enlace(s) fosforotioato en la(s) posicion (posiciones) del esqueleto de nucleotidos que va(n) a quedar intactas, proporciona el patron de escision deseado. La Figura 28C es un dfmero de Xsondas mantenido junto por un enlace 3'-fosforotiolato, y en la Figura 28D se mantiene junto por un enlace 5'-fosforotiolato. Estos enlaces son selectivamente escindibles por ataque qrnmico, por ejemplo, con yodoetanol como se describe por Gish et al. (“DNA and RNA sequence determination based on phosphorothioate chemistry”, Science 240(4858): 15201522, 1988) o por escision con cationes metalicos divalentes como se describe por Vyle et al. (“Sequence- and strand-specific cleavage in oligodeoxyribonucleotides and DNA containing 3'-thiothymidine”. Biochemistry 31(11): 3012-8, 1992). Otras opciones de escision de esqueleto incluyen, pero no se limitan a, escision fotoredox inducida por UV (como por adaptacion de grupos de fotoescision de nitrobencilo) como se describe por Vallone et al. (“Genotyping sNps using a UV-photocleavable oligonucleotide in MALDI-tOf MS”, Methods Mol. Bio. 297:169-78, 2005), escision por acido de enlaces fosforamidato como se describe por Obika et al. (“Acid-Mediated Cleavage of Oligonucleotide P3'^N5' Phosphoramidates Triggered by Sequence-Specific Triplex Formation”, Nucleosides, Nucleotides and Nucleic Acids 26(8,9): 893-896, 2007) y escision catalizada por peryodato de modificaciones del esqueleto de 3'-O-B-D-ribofuranosil-2'-desoxi como se desvela por Nauwelaerts et al. (“Cleavage of DNA without loss of genetic information by incorporation of a disaccharide nucleoside”, Nucleic Acids Research 31(23): 6758-6769, 2003).
Al igual que con las Xsondas, la escision del esqueleto de poli-Xmero para producir un Xpandomero se lleva a cabo en una variedad de formas. Como se muestra en la Figura 29A, por ejemplo, un Xmero que contiene una base de ribonucleotido digerible con RNasa puede escindirse selectivamente en aquella posicion siempre que el (los) otro(s) nucleotido(s) en el Xmero sean resistentes a la escision por RNasa (por ejemplo, nucleobases de 2'-O-metilpentosa y 2'-desoxiribosa, nucleobases de LNA “bloqueado” y nucleobases enlazadas por glicol o peptido). Para el Xmero descrito en la Figura 29A, la base en 5' es un ribonucleotido de 2'-hidroxilo estandar citidina y la base de 3' es un desoxirribonucleotido de 2' resistente a RNasa guanina. El diseno del Xmero permite la escision selectiva por RNasa del esqueleto de Xmero para expandir un Xpandomero. Alternativamente, como se muestra en la Figura 29B, la DNasa puede usarse para escindir todos los enlaces de esqueleto protegidos no de fosforotioato. Por consiguiente, una biblioteca 2mera, por ejemplo, con un enlace fosfato estandar entre los puntos de union de anclaje y el (los) enlace(s) fosforotioato en la(s) posicion (posiciones) del esqueleto de nucleotidos que van a permanecer intactas,
5
10
15
20
25
30
35
40
45
50
55
proporciona el patron de escision deseado. La Figura 29C es un dfmero de Xmero mantenido junto por un enlace 3'- fosforotiolato, y la Figura 29D se mantiene junta por un enlace 5'-fosforotiolato. Estos enlaces son selectivamente escindibles por ataque qmmico, por ejemplo, con yodoetanol o por escision con cationes metalicos divalentes como se ha citado previamente. Otras opciones de escision del esqueleto incluyen (pero no se limitan a) escision fotoredox inducida por UV (como por adaptacion de grupos de fotoescision de nitrobencilo) y escision por acido de enlaces fosforamidato, ambos de los cuales se han citado anteriormente en la Figura 28. En las Figuras 29A a 29D, los anclajes para conectar el enlace selectivamente escindible de la sonda se indican en (292) y (294).
Volviendo ahora a la Figura 30, en una primera realizacion general de un esquema para la smtesis de la construccion de sustrato de clase I de “sonda-bucle”, dos residuos de nucleobase (drculos) en la segunda y tercera posiciones sobre la sonda se modifican para crear puntos de union L1 y L2 para los dos extremos L1' y L2' del anclaje. El anclaje se muestra aqrn como pre-ensamblado por separado y esta unido al miembro de sonda en una etapa sintetica (flecha). Los enlaces disulfuro intra-anclaje (representados por los dos triangulos) pueden usarse en el ensamblaje y uso de estas construcciones de sustrato. La introduccion de un agente reductor al producto de Xpandomero rompera selectivamente los puentes de disulfuro que mantienen juntos el anclaje, permitiendo asf la expansion del esqueleto del Xpandomero. Tambien son utiles enlaces fotoescindibles en los anclajes de plegamiento durante el ensamblaje con posterior liberacion y desplegamiento tras la exposicion a luz.
En otras realizaciones, el esqueleto de fosfodiester del sustrato puede modificarse para crear puntos de union para el anclaje como se ha desvelado por Cook et al. (“Oligonucleotides with novel, cationic backbone substituents: aminoethylphosphonates”, Nucleic Acids Research 22(24): 5416-5424, 1994), Agrawal et al. (“Site specific functionalization of oligonucleotides for attaching two different reporter groups”, Nucleic Acids Research 18(18): 5419-5423, 1990), De Mesmaeker et al., (“Amide backbone modifications for antisense oligonucleotides carrying potential intercalating substituents: Influence on the thermodynamic stability of the corresponding duplexes with RNA- and DNA-complements”, Bioorganic & Medicinal Chemistry Letters 7(14): 1869-1874, 1997), Shaw et al. (Boranophosphates as mimics of natural phosphodiesters in dNa”, Curr Med Chem. 8(10):1147-55, 2001), Cook et al. (patente de EE.UU. N° 5.378.825) y Agrawal (“Functionalization of Oligonucleotides with Amino Groups and Attachment of Amino Specific Reporter Groups”, Methods in Molecular Biology Vol. 26, 1994). Los residuos de nucleobase que constituyen el miembro de sonda pueden estar sustituidos con analogos de nucleobase para alterar la funcionalidad de Xsondas. Por ejemplo, pueden usarse acidos nucleicos bloqueados (“LNA”) para aumentar la estabilidad del duplex de sonda. Si esta previsto el acoplamiento qmmico de Xsondas (en lugar de ligacion enzimatica), los extremos de sonda 5' y 3' pueden derivatizarse adicionalmente para permitir la reticulacion qmmica.
Diseno, composicion y smtesis de construcciones de indicador
En una realizacion, los anclajes se codifican con “construcciones de indicador” que unicamente identifican la secuencia de residuos de nucleobase (o “sonda” de Xsondas, Xmeros, y otros sustratos de oligomero de la Figura 8) o nucleobase (como en XNTP, RT-NTP y sustratos monomericos de la Figura 9) con los que esta anclado. Los indicadores son indicadores o combinaciones de indicadores generalmente asociadas a los anclajes que sirven para “analizar” o “codificar” la informacion de secuencias inherente en los sustratos e inherente en el orden en el que los sustratos se incorporan en el Xpandomero. En algunas realizaciones, el anclaje es solo un espaciador y los indicadores son, o estan asociados con, el sustrato.
La Figura 31 representa un metodo de ensamblaje del anclaje de sustrato similar al de la Figura 30, pero el anclaje pre-ensamblado incluye grupos indicadores (mostrados como las tres porciones rectangulares del anclaje) y se llama una “construccion de indicador”. Las construcciones de indicador y anclajes pueden prepararse mediante una variedad de qrnmicas de polfmeros, y su uso y smtesis se trata en mas detalle aqrn.
En la practica de la presente invencion, los anclajes pueden servir para una variedad de funciones, por ejemplo: (1) como anclaje para enlazar secuencialmente, directa o indirectamente, anclajes adyacentes a lo largo del esqueleto de nucleobases, (2) como espaciador para estirar o expandir de manera que se forme una cadena alargada de subunidades ancladas, denominado un Xpandomero, tras la escision del esqueleto, y/o (3) opcionalmente comprende construcciones de indicador o precursores de indicador que codifican la informacion de nucleobases o de secuencias oligomericas de la construccion de sustrato individual a la que el anclaje esta asociado.
Las construcciones de indicador son manifestaciones ffsicas de codigos de indicador, que son de naturaleza bioinformacional y digital. Los codigos de indicador analizan o codifican la informacion genetica asociada al fragmento de secuencia de la sonda o nucleobase con la que esta unida la construccion de indicador y el anclaje. Las construcciones de indicador se disenan para optimizar la detectabilidad del codigo de indicador ajustando separaciones espaciales, abundancia e intensidad de senales de los indicadores constituyentes. Las construcciones de indicador pueden incorporar un amplio intervalo de elementos de senal y estructurales que incluyen, pero no se limitan a, polfmeros, dendnmeros, perlas, aptameros, ligandos y oligomeros. Estas construcciones de indicador se hacen mediante una variedad de qrnmicas de polfmero y se tratan adicionalmente mas adelante.
En una realizacion, las construcciones de indicador estan unidas a la sonda o nucleobase por un anclaje de polfmero. Los anclajes pueden construirse a partir de uno o mas polfmeros duraderos solubles en agua o disolventes que incluyen, pero no se limitan a, el siguiente segmento o segmentos: polietilenglicoles, poliglicoles, polipiridinas,
5
10
15
20
25
30
35
40
45
50
55
60
poliisocianuros, poliisocianatos, poli(triarilmetil)metacrilatos, polialdeddos, polipirrolinonas, poliureas, fosfodiesteres de poliglicol, poliacrilatos, polimetacrilatos, poliacrilamidas, polivinilesteres, poliestirenos, poliamidas, poliuretanos, policarbonatos, polibutiratos, polibutadienos, polibutirolactonas, polipirrolidinonas, polivinilfosfonatos, poliacetamidas, polisacaridos, polihialuranatos, poliamidas, poliimidas, poliesteres, polietilenos, polipropilenos, poliestirenos, policarbonatos, politereftalatos, polisilanos, poliuretanos, polieteres, poliaminoacidos, poliglicinas, poliprolinas, polilisina N-sustituida, polipeptidos, peptidos sustituidos con N en la cadena lateral, glicina poli-N-sustituida, peptoides, peptidos sustituidos con carboxilo en la cadena lateral, homopeptidos, oligonucleotidos, oligonucleotidos de acido ribonucleico, oligonucleotidos de acido desoxinucleico, oligonucleotidos modificados para prevenir el apareamiento de bases de Watson-Crick, analogos de oligonucleotidos, acido policitidflico, acido poliademlico, acido poliuridflico, politimidina, polifosfato, polinucleotidos, polirribonucleotidos, fosfodiesteres de polietilenglicol, analogos de peptido-polinucleotido, analogos de treosil-polinucleotido, analogos de glicol-polinucleotido, analogos de morfolino-polinucleotido, analogos de oligomeros de nucleotidos bloqueados, analogos de polipeptidos, polfmeros ramificados, poKmeros en peine, polfmeros en estrella, poKmeros dendnticos, copolfmeros aleatorios, en gradiente y de bloque, polfmeros anionicos, poUmeros cationicos, poKmeros que forman tallo-bucles, segmentos ngidos y segmentos flexibles. Tales polfmeros pueden estar circularizados en puntos de union sobre una construccion de sustrato como se describe en, por ejemplo, en las Figuras 30 y Figura 31.
El anclaje es generalmente resistente al entrelazamiento o se pliega de manera que sea compacto. Polietilenglicol (PEG), poli(oxido de etileno) (PEO), metoxipolietilenglicol (mPEG), y una amplia variedad de derivados de PEG similarmente construidos (PEG), son polfmeros ampliamente disponibles que pueden utilizarse en la practica de la presente invencion. Los PEG modificados estan disponibles con una variedad de reticuladores de extremos bifuncionales y heterobifuncionales y se sintetizan en un amplio intervalo de longitudes. Los PEG son generalmente solubles en agua, metanol, benceno, diclorometano, y muchos disolventes organicos comunes. Los PEG son polfmeros generalmente flexibles que normalmente no interaccionan no espedficamente con productos qmmicos biologicos.
La Figura 32A ilustra la estructura de repeticion de un polfmero de PEG. La Figura 32B muestra una Xsonda o Xmero con un anclaje de PEG desnudo asegurado al esqueleto de sonda por, por ejemplo, conectores terminados en amina (no mostrados) que usan qmmicas de conectadores estandar. La Figura 32C muestra la misma construccion de sustrato despues de la escision del esqueleto de sonda en un enlace selectivamente escindible (“V”), acomodando el polfmero de PEG flexiblemente el alargamiento del Xpandomero. En algunas realizaciones, los segmentos del polfmero de PEG se ensamblan a trozos sobre el anclaje para proporcionar la longitud de expansion o para minimizar cuestiones estericas, tales como, por ejemplo, en los tallos de los anclajes proximos a los enlaces de extremos terminales que conectan los brazos de anclaje con el sustrato.
Otros polfmeros que pueden emplearse como anclajes, y proporcionan “andamiaje” para indicadores, incluyen, por ejemplo, poli-glicina, poli-prolina, poli-hidroxiprolina, poli-cistema, poli-serina, acido poli-aspartico, acido poli- glutamico, y similares. Pueden usase las funcionalidades de la cadena lateral para construir andamiajes ricos en grupos funcionales para capacidad o complejidad de senales anadida.
La Figura 33A muestra la estructura de poli-lisina. En las construcciones de anclaje realizaciones descritas en la Figura 33B a 33D, los segmentos de anclaje de poli-lisina crean un andamiaje para la union del indicador. En la Figura 33B, los grupos e-amino de las cadenas laterales de lisina (indicados porflechas) proporcionan funcionalidad para la union de pluralidades de elementos indicadores a una construccion de sustrato, amplificando el codigo de indicador. La Figura 33C ilustra un dendnmero en estrella unido a una construccion de sustrato) con cadenas laterales de poli-lisina (flechas).
La Figura 33D ilustra la carga de los oligomeros de dendnmero que puede detectarse anadiendo oligomeros complementarios marcados en una etapa de marcado post-ensamblaje y de “amplificacion de senal”. Esto proporciona un metodo util para preparar un anclaje universal uniendo un complejo dendnmero sin marcar con multiples grupos indicadores oligomericos a una sonda, y luego tratando el dendnmero unido a la sonda con una seleccion de una o dos sondas marcadas complementarias, se obtiene un dendnmero “pintado” espedfico para las especies de sustrato individuales. Pueden pintarse diferentes construcciones de sonda/anclaje con diferentes sondas marcadas complementarias.
En otra realizacion de este enfoque, el esqueleto del sistema de indicador comprende ocho oligonucleotidos unicos que estan espacialmente codificados de un modo binario usando dos indicadores fluorescentes distinguibles, cada uno excitado mediante el mismo donante de FRET. Antes de o tras el acoplamiento de las construcciones de anclaje a su construccion de sustrato respectiva, las construcciones de anclaje se codifican por secuencia por hibridacion de la mezcla apropiada de elementos indicadores fluorescentes para crear el codigo binario espedfico de sonda apropiado. Se emplean variaciones de este enfoque usando dendnmeros codificados, sin marcar, polfmeros, polfmeros ramificados, o perlas como esqueleto del sistema de indicador. Los oligonucleotidos pueden de nuevo usarse para la codificacion binaria de la construccion de indicador. Una ventaja con este enfoque es que la intensidad de senales se amplifica significativamente y que la codificacion no es dependiente tras un unico acontecimiento de hibridacion, ambos de los cuales disminuyen la posibilidad de medicion y/o error de codificacion.
5
10
15
20
25
30
35
40
45
50
55
60
Todavfa otra realizacion sustituye la estrategia de codificacion de oligonucleotidos anteriormente descrita con ligandos heteroespedficos unidos por afinidad para producir, por ejemplo, una construccion de indicador codificada similarmente binaria. Usando una estrategia de codificacion binaria de 9 bits, esta construccion de indicador no universal, en su forma mas simple, emplea solo una unica qmmica de acoplamiento para marcar simultaneamente todos los anclajes.
Dada la flexibilidad del enfoque de SBX, se usa una amplia variedad de indicadores para producir senales medibles unicas. Cada anclaje esta unicamente codificado por uno o muchos segmentos de indicador distintos. El andamiaje con el que los restos de indicador estan unidos puede construirse usando una amplia variedad de caractensticas estructurales existentes que incluyen, pero no se limitan a, dendnmeros, perlas, polfmeros y nanopartmulas. Dependiendo del esquema de codificacion, pueden usarse uno o muchos andamiajes de indicador distintamente separados para el codigo de indicador de cada anclaje. Esta disponible cualquier numero de opciones para la union directa e indirecta de restos de indicadores con el andamiaje de indicador, que incluyen (pero no se limitan a): codificacion de indicador de polfmero(s) qmmicamente reactivo(s) integrado(s) en las construcciones de anclaje; codificacion de indicador de grupos superficiales qmmicamente reactivos sobre dendnmero(s) integrado(s) en el esqueleto de anclaje; y codificacion de indicador de grupos superficiales qmmicamente reactivos sobre perla(s) integrada(s) en el anclaje. En este contexto, una “perla” se considera ampliamente para indicar cualquier partmula o microesfera cristalina, polimerica, de latex, o de material compuesto. Para los tres ejemplos, la abundancia de indicador puede aumentarse significativamente uniendo, con los andamiajes de indicador, polfmeros que se cargan con multiplos de indicadores. Estos polfmeros pueden ser tan simples como un poli-lisina de 100 residuos o mas avanzado, tal como sondas oligomericas marcadas.
Tambien pueden usarse construcciones de anclaje de tamano reducido. Por ejemplo, las construcciones de anclaje pueden alargarse en una etapa post-procesamiento usando metodos dirigidos para insertar unidades de separacion, reduciendo asf el tamano del anclaje de indicador.
La reduccion del tamano y masa de la construccion de sustrato tambien puede lograrse usando anclajes sin marcar. Eliminando los indicadores voluminosos (y el andamiaje de indicador tal como dendnmeros, que para algunas realizaciones codificantes comprende mas del 90 % de la masa del anclaje), pueden potenciarse la cinetica de hibridacion y/o de acoplamiento. Entonces pueden emplearse marcado del anclaje post-ensamblaje. Los indicadores estan unidos a una o mas qmmicas de enlace que estan distribuidas a lo largo de las construcciones de anclaje usando estrategias espaciales o combinatorias para codificar la informacion de secuencias base. Un esquema de codificacion binaria simple puede usar solo una qmmica de enlace reactivo para el marcado del post-ensamblaje del Xpandomero. Esquemas de marcado mas complicados, que pueden requerir cientos de conectores unicos, usan una estrategia basada en oligonucleotidos para el marcado de Xpandomeros. Otra realizacion de Xsondas o Xmeros post-marcado es usar las secuencias de nucleotidos resultantes derivadas de P1 y P2 (vease la Figura 10) que siguen tras la escision y la expansion del Xpandomero para la union del indicador por hibridacion de una biblioteca de sondas marcadas. Similarmente, otras tecnicas de marcado y/o de deteccion pueden identificar directamente los nucleotidos mas espacialmente resueltos.
Se emplean anclajes y construcciones de indicador que se unen a las construcciones de sustrato con un nivel de exactitud deseado, ya que el acoplamiento erroneo conduce a ineficiencias en la deteccion, y tambien puede conducir a la terminacion de polfmeros o reordenamiento del codigo de indicador (por ejemplo, si se usa un codigo de indicador asimetrico). La fidelidad del proceso de SBX puede ligarse a la pureza de smtesis de las construcciones de sustrato. Tras la purificacion de la construccion de anclaje/indicador para enriquecer el producto de longitud completa, la construccion puede acoplarse directamente a una sonda de oligonucleotidos heterobifuncional (codificacion de indicador direccional) u homobifuncional (codificacion de indicador simetrica u orientada). Al igual que con todos los metodos de smtesis de polfmeros, la purificacion (tamano, afinidad, HPLC, electroforesis, etc.) se utiliza tras completarse la smtesis de construcciones de sustrato y el ensamblaje para garantizar la alta pureza de construcciones de sonda expansibles de longitud completa.
Smtesis de construcciones de sustratos de clase I que presentan indicadores
La smtesis de construcciones de sustrato de clase I con indicadores o precursores de indicador presentados sobre los anclajes puede llevarse a cabo en una variedad de formas. Puede usarse un proceso escalonado para ensamblar un polfmero de anclaje en horquilla que esta conectado cerca de los extremos de union del anclaje de la construccion de sustrato mediante un puente de disulfuro. Esto orienta los extremos reactivos de forma que el acoplamiento del anclaje a la sonda este altamente favorecido. Estan comercialmente disponibles fosforamiditos con modificador de amino C6 para los cuatro nucleotidos (Glen Research, EE.UU.) y se usan para unir el anclaje para formar, por ejemplo, la construccion de sustrato completada. Alternativamente, puede emplearse qmmica de conectores en forma de nucleotidos modificados con benzaldefndo. La purificacion por tamano y/o afinidad es util para enriquecer las construcciones de sustrato correctamente ensambladas.
La heterobifuncionalizacion de sondas puede hacerse ventajosamente sobre una matriz de soporte solido, como es habitual para la smtesis de oligos y de peptidos, o en disolucion con metodos de purificacion apropiados. Estan disponibles una amplia variedad de reactivos de reticulacion heterobifuncionales y homobifuncionales listos para uso para modificar, por ejemplo, restos amina, carboxilo, tiol e hidroxilo, y para producir una variedad de qmmicas de
5
10
15
20
25
30
35
40
45
50
55
60
enlace robustas y selectivas. Como los modificadores de C6 amino estan disponibles para los cuatro desoxirribonucleotidos, y pueden ponerse a disposicion para los cuatro ribonucleotidos, las estrategias de funcionalizacion descritas aqm usan metodos de reticulacion basados en amina listos para uso junto con qmmicas de proteccion/desproteccion de amina bien establecidas. Sin embargo, dado la amplia variedad de qmmicas de fosforamidito y de reticulacion conocidas en la tecnica, los metodos no descritos aqm tambien pueden considerarse y producir productos equivalentes.
La necesidad de heterobifuncionalizacion de la sonda puede eliminarse si la estrategia de codificacion del indicador produce codificacion digitalmente simetrica o usa puntos de referencia direccionales (bits de paridad) para identificar la orientacion de codigos. En este caso, son suficientes dos modificadores de sonda de amina interna, ya que cualquier orientacion de acoplamiento de las construcciones de indicador en el anclaje producina una identificacion de secuencias espedfica de sonda unica.
Pueden ensamblarse uno o muchos segmentos de polfmero secuencialmente usando enlaces covalentes catalizados por productos qmmicos (por ejemplo, reticuladores) o enzimas (por ejemplo, hibridacion y ligacion de sondas de acido nucleico) para formar un anclaje circular funcionalizado en los extremos. Dado el actual estado de la tecnica para los metodos de smtesis de polfmeros, el enfoque de smtesis de reticulaciones qmmicas constituye una realizacion representativa. Como es habitual para muchos metodos de smtesis de polfmeros, puede usarse una matriz de soporte solido como andamiaje para la smtesis. Los segmentos de polfmeros pueden ensamblarse uno cada vez basandose en la funcionalizacion de extremos, como segmentos de pares mixtos que tienen funcionalizaciones de extremos diferentes, o como pares unidos - dos segmentos de polfmero con diferentes restos terminales homobifuncionales (por ejemplo, hidrazida y amina) emparejados mediante puentes de disulfuro.
Las qmmicas de marcado, que incluyen tanto los restos de conector como de elemento indicador, se desarrollan y optimizan basandose en el alto rendimiento de senales y estabilidad, baja reactividad cruzada de polfmeros y entrelazamiento, y la rigidez estructural (refuerzo) que estas qmmicas confieren al esqueleto de Xpandomero, que puede ser importante para la preparacion de muestras y deteccion como se trata mas adelante.
En la Figura 31 tratada anteriormente, la construccion de anclaje en horquilla/de indicador completa se ensambla independientemente de la sonda de oligonucleotidos y luego se une por qmmicas de conector homobifuncional o heterobifuncional al miembro de sonda. En una realizacion alternativa, como se muestra en la Figura 34, los anclajes se circularizan escalonadamente por construccion sobre secuencias de sondas inmovilizadas. La construccion de indicador y anclaje se sintetizan con segmentos de anclaje heterobifuncionales (direccionales) u homobifuncionales (simetricos u orientados) enlazados directamente a una sonda de oligonucleotidos. La secuencia de sonda mostrada en la Figura 34A es un 4mero e incluye restos de sonda P1 y P2 (el segundo y tercer drculos) separados por un enlace selectivamente escindible (“V”). Se usan tecnicas de smtesis en estado solido en la smtesis de la construccion de indicador. Esta smtesis se integra con cierre del bucle de anclaje. En la etapa I de la Figura 34A, un primer segmento de anclaje (341) con primer grupo indicador (342) se anade usando qmmica de grupos funcionales espedficos indicados por L1 y L1' (el conector L1 sobre uno de los restos de sonda se bloquea, como se representa por el pequeno rectangulo). En la etapa II, un segundo segmento de anclaje (344) con segundo grupo indicador (345) se anade usando qmmica de grupos funcionales espedficos indicados por L2' y L2'. En la etapa III, un tercer segmento de anclaje (346) con grupo indicador (347) se anade usando qmmica de grupos funcionales espedficos indicados por L2 y L1'. En la etapa IV, y tras la eliminacion del grupo de bloqueo del sitio L1 sobre el resto P2 de la sonda (de nuevo representado por el rectangulo pequeno), el bucle se cierra despues del acoplamiento de L1' y L1.
En otra realizacion mas, como se ilustra en la Figura 34B, la qmmica de conectores heterobifuncionales puede usarse de nuevo para garantizar que el anclaje este direccionalmente posicionado sobre la sonda (aunque esto no es necesario para todas las estrategias codificantes). Una sonda 4mera se representa de nuevo con los restos de sonda P1 y P2 (el segundo y tercer drculos) separados por un enlace selectivamente escindible (“V”). En la etapa I, dos anclajes (341,344) con segmentos de indicador (342,345) se ponen en contacto con grupos funcionales L1 y L2 sobre P1 y P2; las qmmicas son espedficas para cada anclaje. Los anclajes en esta etapa pueden estabilizarse con enlaces intra-anclaje (representados por los triangulos contiguos). En la etapa II, un tercer anclaje (346) con segmento de indicador (347) se usa para “encapuchar” los anclajes despues de eliminar grupos de bloqueo (mostrados como los rectangulos pequenos) sobre los segmentos predecesores. El segmento de encapuchado tambien puede estabilizarse con un enlace intra-segmento (de nuevo representado como triangulos contiguos).
Volviendo ahora a la Figura 34C, se muestra una realizacion basada en la adicion de restos de sonda P1 y P2 a enlaces terminales separados de un anclaje preformado. En la etapa I, el anclaje preformado se hace reaccionar primero con P1 poniendo en contacto L1 con L1'. En la etapa II, el anclaje se hace reaccionar entonces con P2 poniendo en contacto L2 con L2'. El anclaje puede estabilizarse por un enlace intra-anclaje (representado por triangulos contiguos), que pone P1 en proximidad con P2. Los dos restos de sonda se ligan entonces en la etapa III para formar el enlace selectivamente escindible (“V”) entre P1 y P2 (el segundo y tercer drculos). La ligacion de P1 y P2 puede facilitarse opcionalmente duplexando dichos restos de sonda con un molde complementario.
En la Figura 35A se desvela otra realizacion para la smtesis de un segmento de construccion de indicador. Usando metodos qmmicos en estado solido, un conector escindible (351) se ancla primero sobre un sustrato solido (350). Un primer segmento de anclaje con un enlace reversible (352) se hace reaccionar con el conector en la etapa I, y
5
10
15
20
25
30
35
40
45
50
55
entonces en la etapa II se hace reaccionar con una biblioteca combinatoria de monomeros M1 y M2, mostrada en este ejemplo como una mezcla estequiometrica 4:1 de los monomeros respectivos. La smtesis de copolfmeros aleatoria se hace de este modo para producir composiciones de segmento de anclaje unicas. Si se usan monomeros de peptido o de aminoacido, esto puede hacerse con qmmica de antudridos mixtos, por ejemplo, produciendo anclajes de peptido de copolfmeros aleatorios de longitud variable (Semkin et al., “Synthesis of peptides on a resin by the mixed anhydride method”, Chemistry of Natural Compounds 3(3):182-183,1968; Merrifield et al., “Solid Phase Peptide Synthesis. I. The Synthesis of a Tetrapeptide”. J. Am. Chem. Soc. 85(14):2149-2154, 1963). En la etapa III, un elemento conector de extremos (356) bloqueado en L1 (representado como un rectangulo pequeno) se anade entonces al segmento de peptido. Tras la escision del segmento del soporte solido (no mostrado), el segmento de anclaje puede incorporarse en una construccion de indicador usando una variedad de metodos, algunos de los cuales se describieron en la Figura 34.
En la Figura 35B se demuestra una alternativa a esta realizacion. Una construccion de indicador con fragmentos de peptido aleatoriamente incorporados se sintetiza como antes en las etapas I, II y III, pero en la etapa III el grupo conector de extremos (358) esta provisto de un conector heterofuncional L2. Diferente del ejemplo previo, los monomeros se proporcionan en proporciones iguales. Despues de la escision del soporte solido (no mostrado), la construccion de indicador esta disponible para la incorporacion adicional en anclajes de los ejemplos previos y es un conector heterobifuncional. Las construcciones de indicador sirven para codificar la informacion genetica del fragmento de la secuencia de sonda, como se describe mas abajo en mas detalle.
Los polipeptidos son construcciones de indicador utiles y tambien sirven de anclajes. Pueden utilizarse copolfmeros aleatorios, periodicos, alternantes y de bloque junto con homopolfmero, por ejemplo, para la composicion del segmento de anclaje y construccion de anclaje. Los segmentos de polipeptido pueden estar funcionalizados en los extremos usando reticuladores heterobifuncionales que contienen succinimidilo para la conversion de amina en, por ejemplo, una hidrazida o 4-formilbenzoato (4FB). Los polipeptidos pueden producirse tanto por smtesis qmmica como por clonacion y expresion en exceso en sistemas biologicos (bacterias, levadura, baculovirus/insecto, mairnfero). Dependiendo de la longitud deseada del segmento, los segmentos de anclaje pueden oscilar de N > 2 (segmentos cortos) a N > 1000 (segmentos largos). Pueden usarse qrnmicas de proteccion de grupos laterales de amina segun convenga. Como una alternativa a usar reticuladores listos para uso, los polipeptidos pueden sintetizarse qmmicamente con restos de hidrazida, 4FB y NHS directamente unidos.
Tambien pueden usarse segmentos de polipeptido funcionalizados en los extremos usando reticuladores heterobifuncionales que contienen maleimido para la conversion de tiol en una hidrazida o 4-formilbenzoato (4FB), en la smtesis de anclajes y construcciones de indicador. Similarmente pueden emplearse segmentos de polipeptido funcionalizados en los extremos que usan reticuladores de EDC para la conversion de carboxilo en una hidrazida (HZ) o 4-formilbenzoato.
La smtesis de las cinco clases de construccion de sustrato oligomerico que tienen anclajes modificados con construcciones de indicador se logra usando los metodos sinteticos anteriores. Similarmente, la smtesis de sustratos monomericos que tienen anclajes modificados con construcciones de indicador tambien puede lograrse por los mecanismos sinteticos anteriores. Las qrnmicas para estas variantes son generalmente aplicables a los generos de especies de Xpandomeros mostradas en las Figuras 8 y 9. Los presentes inventores vuelven ahora a estrategias codificantes y reglas para transportar la informacion genetica en Xpandomeros con construcciones de indicador.
Construcciones de indicador y estrategias de codigo de indicador
Un “codigo de indicador” es una representacion digital de una senal particular o secuencia senal que esta integrada en los indicadores de una construccion de indicador particular. Mientras que la “construccion de indicador” es una manifestacion ffsica de informacion extragenetica, el codigo de indicador es su equivalente digital.
La codificacion digital requiere codigos de indicador para seguir ciertas reglas. Por ejemplo, se requieren al menos 256 codigos de indicador para identificar todas las posibles combinaciones de una biblioteca de Xsondas 4meras. Teniendo mas codigos de indicador de los que son posibles, las combinaciones de construccion de indicador son ventajosas debido a que pueden usarse estados adicionales para otros fines tales como el marcado de huecos, proporcionando informacion posicional o identificando errores de paridad o errores de alto orden.
Pueden considerarse varias estrategias para representar ffsicamente un codigo de indicador. El anclaje puede dividirse en uno o muchos segmentos codificables, pudiendo cada uno marcarse tanto antes como despues del ensamblaje de Xpandomero. Pueden usarse niveles de senal variables (cantidad de marca), longitudes (duracion de senal) y formas de segmentos de construcciones de anclaje marcados para aumentar las opciones de codificacion. La codificacion tambien puede expandirse usando marcas multiplexables. Por ejemplo, usando un enfoque de etiquetado con marca de masa, puede usarse una amplia biblioteca de marcas espectralmente distintas para codificar unicamente un segmento de indicador unico; 14 marcas de masa distintas usadas en combinaciones de tres marcas agrupadas sobre un unico segmento de construcciones de anclaje creanan 364 espectros de 3 masas unicos. Para el anclaje multi-segmentado, el marcado post-ensamblaje del Xpandomero de la mayona o de todo el esqueleto de anclaje puede tener el beneficio anadido de aumentar la rigidez del Xpandomero, haciendo posiblemente mas facil manipular para la deteccion y mejorando la estabilidad.
5
10
15
20
25
30
35
40
45
50
55
60
La Figura 36A (y tambien la Figura 2A) ilustra un anclaje con un unico segmento de indicador de una Xsonda o un Xmero. Este enfoque se beneficia del marcado de indicador altamente multiplexable, tal como marcas de espectrometro de masas, para producir una amplia biblioteca de salidas espectralmente distintas. Una marca de masa escindible es una molecula o complejo molecular de indicadores escindibles que puede ser facilmente ionizado a un numero mmimo de estados de ionizacion para producir espectros de masas precisos. Cuando se controla cuidadosamente, un espectrometro de masas puede detectar tan solo algunos cientos de tales indicadores de marca de masa. Este ejemplo de codigo de indicador no necesita informacion posicional del indicador sobre el esqueleto de anclaje para determinar el estado del codigo (aunque se requiere informacion posicional para distinguir un codigo de indicador del siguiente). Esta caractenstica simplifica la construccion de anclaje y posiblemente acorta los requisitos de longitud del anclaje.
En una realizacion, usando etiquetas de marca de masa escindibles, el Xpandomero alargado puede presentarse para la deteccion mediante una fuente de iones de nanoporo (ionizacion por electropulverizacion, ionizacion qmmica a presion atmosferica, fotoionizacion) o por deposicion superficial (nanopeine, nanocanal, flujo laminar, electroforetico y similares) seguido de ionizacion por desorcion con laser, haz de iones, o fuentes de haces de electrones (ionizacion por desorcion con laser asistida por matriz “MALDI”, ionizacion por desorcion con electropulverizacion “DESI”, ionizacion por desorcion sobre sflice “DIOS”, espectrometna de masas de iones secundarios “SIMS”).
Un ejemplo de construcciones de anclaje de 9 bits con 2 estados de deteccion (“1” y “0”), que produce 512 identidades de codigo, se describe en la Figura 36B. En una realizacion, las construcciones de anclaje consisten en los segmentos “1” y “0” que producen dos niveles de impedancia electrica como se mide en un detector de nanoporos tipo Coulter. En una segunda realizacion, las construcciones de anclaje consisten en segmentos conductores de la electricidad “1” y segmentos no conductores “0”. En una tercera realizacion, las construcciones de anclaje consisten en segmentos fluorescentes “1” y segmentos no fluorescentes “0”. Puede considerarse una pluralidad de diferentes elementos indicadores para este tipo de codificacion. Para cualquiera de estos enfoques, la qmmica de ensamblaje de anclaje y de union de sonda puede ser identica - solo necesitana cambiarse la composicion del segmento de indicador. Con este simple formato, el marcado puede hacerse tanto antes como despues del ensamblaje de Xpandomero. Se desea el post-marcado, ya que el segmento de indicador sin marcar es significativamente menos masivo y, como tal, es util a una concentracion mucho mayor que una construccion de indicador completamente marcada. Dependiendo de la estrategia, los segmentos de polfmero pueden ser: (1) codificados mediante qmmicas superficiales conjugables o reactivas (por ejemplo, poli-lisina, acido poli-glutamico), (2) no reactivos (por ejemplo, PEG, polfmeros de baja reactividad), o (3) una mezcla de tanto polfmeros reactivos como no reactivos. Los grupos reactivos incluyen, pero no se limitan a, aminas primarias (-NH3), carboxilos (- COOH), tioles (-SH), hidroxilos (-OH), aldefudos (-RCOH) y restos de hidrazida (-R-N-N). El marcado de segmentos reactivos, que puede incluir la desproteccion de grupos reactivos, puede hacerse directamente en las construcciones de sustrato, despues de la formacion del producto intermedio de Xpandomero, despues de la escision del esqueleto para producir el Xpandomero, o en cualquier otro momento en el proceso de SBX segun convenga para producir los mejores resultados.
Pueden ser posibles niveles adicionales, como se muestra en la Figura 36C. Por ejemplo, una estrategia codificante direccional binaria (construccion de indicador no simetrico) requiere al menos ocho segmentos codificantes de indicador y un noveno segmento, un segmento de encapuchado codificable (para el cierre del bucle de anclaje y como posible punto de referencia de la construccion de sustrato central) para producir los 256 codigos mmimamente requeridos para un sustrato de cuatro bases (512 codigos si el segmento de encapuchado esta codificado).
Volviendo a la Figura 36D, se muestra que una construccion de indicador de 7 bits, cada indicador con tres estados de deteccion, produce 2187 identidades de codigo detectables. El uso de espaciadores de polfmero flexibles puede usarse por motivos estericos.
En la Figura 36E se muestra un equivalente ngido de la construccion de indicador de 7 bits previa.
La Figura 36F describe un ejemplo de construcciones de anclaje de 4 segmentos ngidas con ocho estados distintos totales o combinaciones de marca por segmento. El uso de siete de las combinaciones de marca para marcar tres de las construcciones de segmentos de anclaje producira 343 identidades de codigo unicas y dejara 1 segmento disponible para la identificacion de lfmites de subunidad, paridad, u otro fin funcional. Esta realizacion puede usar un enfoque de marcado mixto en el que pueden incorporarse 1 a 3 marcas diferentes sobre cada segmento para producir al menos ocho combinaciones unicas por segmento como se muestra en la Figura 37, en la que se contemplan combinaciones de diferentes tipos de indicador y qmmica de construccion de indicador. Pueden utilizarse la marca de masa y las opciones de marcado fluorescente, entre otros, como se describe. El marcado de construcciones de anclaje de ensamblaje post-ensamblaje del Xpandomero esta dirigido por la abundancia e identidad de tres restos de reticulador como se describe en la Figura 37. Las longitudes del segmento de anclaje pueden estar en el orden de 100-1000 nm para las mediciones limitadas de difraccion o < 100 nm para las mediciones de campo cercano, si se desea usar estas tecnologfas de deteccion. Pueden usarse anclajes mas cortos para otros metodos de deteccion.
5
10
15
20
25
30
35
40
45
50
55
60
Las construcciones de anclaje de 3 segmentos ngidas con 22 combinaciones de marca distintas totales por segmento se describen en la Figura 36G. El uso de 21 de las combinaciones de marca descritas en la Figura 37 para marcar dos de las construcciones de segmentos de anclaje producira 441 identidades de construcciones de anclaje unicas y dejara un segmento disponible para la identificacion de lfmites de subunidad de Xsondas. Esta realizacion usa un enfoque de marcado mixto en el que de una a tres marcas diferentes pueden incorporarse en cada segmento para producir hasta 22 combinaciones unicas por segmento (Figura 37). Pueden utilizarse la marca de masa y las opciones de marcado fluorescente, entre otros, para esta realizacion. Como se describe en la Figura 37, el marcado de construcciones de anclaje del post-ensamblaje del Xpandomero esta dirigido por la abundancia e identidad de tres restos qmmicos.
Disenando segmentos de indicador/de anclaje en los que la abundancia de grupos reactivos y la dimension espacial (distancia radial desde el esqueleto de polfmero) pueda variarse, pueden lograrse niveles de codificacion en los que al menos son posibles tres estados de codigo total: Alto “2”, Medio “1” y Bajo “0” (Figura 36H). Por otra parte, una estrategia de codificacion de nivel dos, de tres marcas (es decir, 21 estados por indicador) solo requerina dos segmentos codificantes de indicador para producir 441 codigos y podna usar un segmento adicional para la orientacion de codigo (Figura 36I).
La codificacion de indicador puede disenarse para reducir errores inherentes con la construccion de indicador y asociados a tecnologfas de deteccion usando varios enfoques. En el caso de la deteccion de nanoporos tipo Coulter, la velocidad a la que un Xpandomero pasa a traves del poro y la modulacion de la corriente que produce puede depender de muchos factores que incluyen, pero no se limitan a, el estado de carga de la porcion del Xpandomero dentro del poro, las concentraciones de electrolito, los estados de carga superficiales del nanoporo, el potencial aplicado, los efectos de friccion que limitan el movimiento de Xpandomeros, y las dimensiones relativas de tanto el Xpandomero como el nanoporo. Si la velocidad no es predecible, la descodificacion de la modulacion de la corriente no puede usar tiempo (y velocidad constante) para resolver las asignaciones de medicion de indicador. Una realizacion codificante resuelve esta cuestion usando codificacion de 3 estados. La senal del indicador es la impedancia que causa una marca a la conductividad de electrolitos a traves del nanoporo. Proporcionando tres posibles niveles de impedancia para un indicador, un bit de informacion esta codificado por la transicion con la siguiente marca. Por diseno, esta transicion es siempre un cambio a uno de los otros dos estados. Si los tres estados estan marcados A, B y C, entonces una secuencia de indicadores nunca tiene 2 A, 2 B o 2 C juntos. De esta forma, la informacion esta codificada en transiciones de nivel y es, por tanto, independiente de la velocidad a traves del nanoporo. Un esquema codificante es asignar a todas las transiciones A aB, B aC y C aA un valor de “0” mientras que a las transiciones B a A, C aB y A aC se asigna el valor “1”. Por ejemplo, la secuencia detectada ABACBCA se descodifica a 0,1,1,1,0,0.
Aunque el momento preciso no puede resolver de forma fiable marcas secuenciales, puede ser suficiente para diferenciar la separacion de la secuencia de marca sobre construcciones de un unico anclaje de las del siguiente anclaje secuencial. Longitudes de anclaje de espaciadores adicionales en cualquier extremo de la secuencia de marca de indicador (en los puntos de union de la construccion de sustrato) pueden proporcionar un gran hueco de tiempo que delinea los codigos de construcciones de anclaje en el tiempo.
En los casos en los que tal momento adecuado es insuficiente, puede producirse un error del desplazamiento del marco. Los errores del desplazamiento del marco resultan cuando el detector lee una serie de marcas de multiples codigos de construcciones de anclaje (marcos), pero no delinea correctamente el inicio del codigo (inicio del marco). Esto produce codigos erroneos. Una realizacion para resolver esto es anadir mas bits en el codigo que los que se necesitan para identificar las secuencias de bases correspondientes (que normalmente son 1 a 4 bases de longitud). Por ejemplo, se requieren ocho bases para identificar unicamente una secuencia de 4 bases. Cada par de 2 bits describe una base unica. Anadiendo un bit de paridad a cada base, el codigo de las construcciones de anclaje aumenta a 12 bits. Una tasa de error de alta paridad (proxima al 50 %) indicana un error del desplazamiento del marco que producina la ausencia de un cambio de estado. Ademas de una ausencia de cambio de estado, otro tipo de error que puede producirse en esta tecnologfa de deteccion de nanoporos es la de un estado incorrectamente lefdo. Los errores de un unico indicador pueden aislarse a la base particular usando el bit de paridad y puede entonces asignarse el valor “base desconocida”.
Los Xpandomeros marcados usando tanto segmentos de impedancia electrica, de conduccion electrica como fluorescentes pueden medirse en disolucion usando una variedad de formatos de nanoporo, nanopeine o nanocanal. Alternativamente, los Xpandomeros pueden depositarse superficialmente como polfmeros lineales espacialmente distintos usando nanopeine, nanocanal, flujo laminar o metodos de deposicion electroforetica, entre otros. Al igual que con el enfoque de disolucion, la deteccion directa del Xpandomero alargado en la superficie puede hacerse midiendo las caractensticas de senal de segmentos de anclaje marcados. Dependiendo de la composicion del material de deposicion (conduccion, aislamiento) y el sustrato subyacente (conduccion, aislamiento, fluorescente), puede considerarse una variedad de tecnologfas de deteccion para la deteccion de marcas.
Metodos de SBX adicionales
Varios metodos de SBX que usan construcciones oligomericas de sustrato de clase I-V se ilustraron en las figuras previas (Figuras 11-17, 20, 21, 24). Los presentes inventores consideran ahora metodos opcionales que
5
10
15
20
25
30
35
40
45
50
55
complementan estos protocolos. Funcionalizacion de extremos
La Figura 38 ilustra la preparacion y uso de adaptadores de extremos diana. La Figura 38A ilustra oligonucleotidos complementarios funcionalizados en los extremos duplexados para formar un adaptador con un extremo conjugable bifuncional (“L1” y “L2”) y un extremo enzimaticamente ligable (5'-fosfato y 3'-OH). Estos adaptadores tambien pueden disenarse con funcionalidades adicionales. Por ejemplo, como se muestra en la Figura 38B, pueden sintetizarse adaptadores funcionalizados en los extremos con reticuladores de esqueleto anidados (“L3”) y un enlace escindible (“V”). Por simplicidad, el enlace escindible V puede tener la misma qmmica de enlaces escindibles (o enzimologfa) usada para liberar o expandir el Xpandomero, aunque pueden utilizarse otros conectores escindibles si se desea diferenciar entre etapas de escision independientes. Las Figuras 38C y 38D muestran etapas para la construccion de un adaptador multifuncional de la Figura 38B. Como se muestra, puede usarse una perla magnetica con un oligonucleotido anclado en la superficie complementaria a cada hebra de adaptador (dos mezclas de perlas diferentes) para ensamblar segmentos de oligonucleotidos diferencialmente modificados. Una vez ensamblados, los segmentos pueden ligarse enzimaticamente para enlazar covalentemente los segmentos hibridados. Con este enfoque, cada segmento puede modificarse individualmente de un modo no disponible para la smtesis de oligonucleotidos estandar.
La manipulacion del Xpandomero puede ser util para la eficaz presentacion y deteccion de muestras. Por ejemplo, pueden usarse marcas de afinidad terminales para modificar selectivamente un extremo del Xpandomero para permitir el alargamiento electroforetico. La union de un modificador voluminoso de carga neutra a cualquiera del extremo 3' o 5' (no ambos) produce un arrastre electroforetico sobre el Xpandomero que hace que el extremo no modificado se alargue a medida que se desplaza con el detector. Los modificadores de extremos, que incluyen, pero no se limitan a, microperlas, nanopartmulas, nanocristales, polfmeros, polfmeros ramificados, protemas y dendnmeros, pueden usarse para influir en la estructura (alargamiento), posicion y tasa a la que el Xpandomero se presenta al detector confiriendo propiedades diferenciadoras unicas a sus extremos tales como carga (+/-/neutra), flotabilidad (+/-/neutra), hidrofobia y paramagnetismo, por nombrar algunos. En los ejemplos proporcionados, las modificaciones de extremos producen una carga de arrastre que permite que el Xpandomero se alargue; sin embargo, tambien puede emplearse la estrategia opuesta en la que la modificacion de extremos se usa para tirar del Xpandomero hacia y a traves del detector. Con este enfoque, el tirar del modificador de extremos facilita el alargamiento del Xpandomero. El adaptador de extremos sobre la hebra molde puede tambien opcionalmente contener uno o mas acidos nucleicos que se usaran para sintetizar el registro del marco y las senales de validacion en el Xpandomero acabado (vease la Figura 54).
La incorporacion de un modificador de la afinidad puede hacerse tanto antes de, durante, como despues de la smtesis de Xpandomeros (hibridacion, ligacion, lavado, escision). Por ejemplo, los cebadores marcados con afinidad terminal que son complementarios a la secuencia de adaptador pueden pre-cargarse a la diana de ADNmc bajo condiciones altamente espedficas antes de la smtesis de Xpandomeros. El cebador y su marca de afinidad pueden incorporarse en el Xpandomero de longitud completa y pueden usarse para modificar selectivamente su extremo. Un enfoque posiblemente mas elegante es incorporar enzimaticamente modificadores de los extremos. La transferasa terminal (TdT), por ejemplo, es una polimerasa independiente de molde que cataliza la adicion de desoxinucleotidos al extremo 3' hidroxilo de moleculas mono o bicatenarias de ADN. Se ha demostrado de TdT anade nucleotidos modificados (biotina) al extremo 3' (Igloi et al., “Enzymatic addition of fluorescein- or biotin-riboUTP to oligonucleotides results in primers suitable for DNA sequencing and PCR”, BioTechniques 15, 486-497, 1993). Un amplio intervalo de enzimas son adecuadas para este fin, que incluyen (pero no se limitan a) ARN ligasas, ADN ligasas y ADN polimerasas.
En las Figuras 38E y 38F se ilustran adaptadores en horquilla. Los adaptadores en horquilla encuentran uso en la ligacion de extremos romos para dar hebras molde auto-cebadoras. Una ventaja de este enfoque es que la hebra hija sigue covalentemente acoplada a la hebra molde y se re-hibrida mas rapidamente tras una fusion para eliminar material sin ligar y fragmentos de bajo peso molecular. Como se muestra en la Figura 38F, estos adaptadores pueden contener funcionalidades de conector pre-formadas incorporadas para la purificacion o manipulacion aguas abajo, y tambien pueden contener sitios de escision para la recogida mas eficaz de las hebra hijas del Xpandomero.
Preparacion y analisis del molde diana
Para realizar la secuenciacion del genoma completo de ADN continuo largo, el uso de los metodos de SBX basados en Xsonda supone que el ADN se prepara en una forma manejable para la hibridacion, ligacion, llenado de huecos si se requiere, la expansion y medicion. El proceso de ensamblaje de Xpandomeros puede mejorarse, en algunas realizaciones, por inmovilizacion superficial de la diana de ADN con el fin de (1) reducir la complejidad y efectos cruzados de la hibridacion, (2) mejorar el lavado, (3) permitir la manipulacion de diana (alargamiento) con el fin de facilitar la hibridacion mejorada, y/o (4) si se usa sensor de nanoporos, proporcionar una interfase continua con el proceso de deteccion. Como se describe en detalle mas adelante, se espera que los metodos para la preparacion de molde diana, analisis y union superficial mejoren la calidad de los datos y el ensamblaje de secuencias.
5
10
15
20
25
30
35
40
45
50
55
La mayona de los metodos de secuenciacion del genoma completo requieren la fragmentacion del genoma diana en trozos mas manejables. El cromosoma mas largo en el genoma humano (cromosoma 1) tiene ~227 Mb y el cromosoma mas pequeno (cromosoma 22) tiene ~36 Mb. Para la mayona de las realizaciones altamente procesivas y continuas descritas en el presente documento, 36 Mb de secuenciacion continua es demasiado largo para ser secuenciado con alta eficiencia. Sin embargo, para aprovechar la capacidad inherente de la larga longitud de lectura de SBX, como diana se eligen longitudes de fragmentos de ADN de >1 kb. Por consiguiente, pueden emplearse varias estrategias para realizar la fragmentacion del genoma y preparar un conjunto de diana de ADN compatible con el metodo de SBX como se ha desvelado en el presente documento.
Una realizacion implica fragmentar el genoma total en trozos de 1-10 Kb (promedio 5 Kb). Esto puede hacerse tanto por enzimas de restriccion como por cizallamiento hidrodinamico/mecanico. Los fragmentos se hacen entonces romos en los extremos y se reparan en la preparacion para la ligacion de extremos romos a un adaptador de secuencia (“SA”) o una construccion de adaptador de secuencia-dendnmero (“SAD”). El extremo no romo de SA o la construccion SAD se disena para ser incapaz de ligacion, de manera que se prevenga el ensamblaje de multfmeros de dichos adaptadores. Cualquier diana ligada a SA o SAD que este presente puede purificarse por afinidad lejos de los adaptadores libres. En este momento, si el dendnmero de captura no se introduce con la construccion de SA, entonces esto puede hacerse (usando un exceso eficaz de dendnmero), seguido de purificacion para aislar el complejo de diana-SAD. Una vez purificado, el complejo esta listo para la union a la superficie de ensayo. Para este fin, se desea que solo un unico complejo diana se una por localizacion de reaccion. Alternativamente, el dendnmero de captura puede en su lugar asociarse a la superficie de ensayo, en cuyo caso el complejo de diana-SA purificado puede unirse directamente al dendnmero que ya esta localizado y unido covalentemente a la superficie. Un metodo similar de ensamblaje de diana de ADN sobre superficies se ha desvelado por Hong et al. (“DNA microarrays on nanoscale-controlled surface”, Nucleic Acids Research, 33(12): e106, 2005).
Otro enfoque, llamado el metodo de “analisis”, implica fragmentar gruesamente el genoma en trozos de 0,5-5 Mb (usando enzimas de restriccion de corte raras o por cizallamiento hidrodinamico/mecanico), seguido de captura de tales fragmentos a una micromatriz modificada (o superficie de division) compuesta de sondas de captura de oligonucleotido espedficas de gen/loci. Estan ampliamente disponibles micromatrices a medida y conjuntos de sondas de captura de oligonucleotidos de varias fuentes comerciales (Arraylt, Euorfins-Operon, Affymetric Inc.). Este analisis adicional puede proporcionar una ventaja para el ensamblaje de secuencias del extremo trasero. La captura de estos grandes fragmentos implica tanto la desnaturalizacion diana parcial como completa con el fin de permitir que las sondas de captura se unieran o duplexaran con ADN diana espedficos. Para reducir la hibridacion no espedfica puede ser necesario cargar la matriz de captura bajo condiciones diluidas de manera que se prevenga la hibridacion cruzada entre moldes.
Cada conjunto de sondas de captura de division, que puede presentarse sobre una gran superficie, se disena para proporcionar resolucion del genoma lineal de ~3 Mb. Para proporcionar el eficaz analisis del genoma, cada conjunto de sondas de captura individual puede estar compuesto por 3 a 5 oligonucleotidos espedficos de gen/loci, linealmente separados sobre el genoma por 0,5-1,5 Mb cada uno. Las sondas de captura se seleccionan para ser completamente unicas con el fragmento diana, proporcionando asf tanto la especificidad como la redundancia al metodo. Dada la resolucion de 3 Mb de un genoma de 3 Gb, este enfoque requiere una matriz de captura compuesta de sondas especificas de aproximadamente 1000 genes/loci. Los conjuntos de sondas de captura de oligonucleotidos listos para micromatriz espedficos parar las dianas de gen humano estan ampliamente disponibles listos para su uso (Operon Biotechnologies, Huntsville AL, EE.UU.).
Una vez se han eliminado los acontecimientos de union no espedfica, cada matriz de captura puede entonces avanzar como reacciones independientes a traves del resto del proceso de preparacion del genoma del mismo modo que se ha tratado anteriormente para el metodo no de analisis. Siendo la diferencia primaria que la muestra diana puede ahora analizarse posicionalmente en una superficie de ensayo de SBX o como reacciones basadas en disolucion individual, reduciendose asf la complejidad del post-ensamblaje de la secuencia de adquisicion de datos.
Otra realizacion es tener hibridacion de Xsonda-diana no anclada y produccion de Xpandomeros. En este caso, el ensayo de SBX se realiza en disolucion libre. Este enfoque pueden usar una o una combinacion de manipulaciones ffsicas tales como usar marcas electroforeticas, magneticas, de arrastre, o funcionalidades terminales de flotabilidad positiva/negativa bajo condiciones estaticas o de flujo laminar, como un medio para alargar el ADN diana antes de y durante la hibridacion y ligacion de sondas, por ejemplo, y, para alargar o expandir el Xpandomero escindido antes de la deteccion. La smtesis en disolucion libre de Xpandomeros, sin inmovilizacion, puede hacerse usando polimerasas y ligasas (con y sin cebadores) y tambien puede hacerse usando metodos de ligacion qrnmica. Pueden usarse tanto construcciones de sustrato de trifosfato como construcciones de sustrato de monofosfato. Se concibe la smtesis simultanea de Xpandomeros de dianas de acido nucleico multiples y mixtas. Generalmente, las construcciones de trifosfato de sustrato son capaces de polimerizacion procesiva continua en disolucion y pueden adaptarse a protocolos de un unico tubo para la secuenciacion de una unica molecula masivamente en paralelo en disolucion libre, por ejemplo.
5
10
15
20
25
30
35
40
45
50
55
60
Ensamblaje superficial de dianas de acido nucleico
Un metodo de preparacion de acidos nucleicos diana para la secuenciacion usa diana de ADN bicatenario funcionalizado en los extremos como se muestra en la Figura 39. Para este ejemplo, cada adaptador normalmente esta provisto de un grupo ANH (hidrazida reactiva) util para el procesamiento adicional, por ejemplo, usando qmmica de enlace de 4-hidrazinonicotinato-acetona-hidrazona de succinimidilo (SANH) y un duplex de oligonucleotidos de adaptador modificado en los extremos con amina. Similarmente, puede usarse una SANh reactiva con amina para crear restos de hidrazida reactivos. SANH se conjuga facilmente con aldehudos como 4-formilbenzoato (4-FB) para formar enlaces hidrazona covalentes estables. El 4-formilbenzoato de C6-succinimidilo reactivo con amina (C6 SFB) puede usarse para crear un resto benzaldehudo reactivo. Los oligonucleotidos complementarios funcionalizados en los extremos se duplexan para formar un extremo conjugable bifuncional (SANH y amina) y un extremo enzimaticamente ligable (3'-OH y 5'-fosfato). La ligacion del adaptador crea un diana de ADNbc funcionalizado en los extremos que puede reticularse a los grupos aldehudo anclados a la superficie. La Figura 39 ilustra diana de ADNbc funcionalizado en los extremos usando SANH y duplex de oligonucleotidos de adaptador modificados en los extremos con amina.
Para muchos de los metodos de SBX descritos, las dianas de acido nucleico pueden anclarse covalentemente a un soporte solido recubierto plano (acero inoxidable, silicio, vidrio, oro, polfmero). Como se describe en la Figura 40, los puntos de union diana pueden producirse por derivatizacion de 4FB de una monocapa de SAM. El metodo utiliza el adaptador ANH de la Figura 39, y en la etapa I de la Figura 40, el ANH se hace reaccionar con las cabezas 4FB de la monocapa y el molde se desnaturaliza (etapa II). La otra hebra del molde, que tambien esta marcada en los extremos, puede capturarse en una reaccion separada. En la etapa III, la amina libre en el extremo 3' del molde monocatenario se hace reaccionar entonces con una perla, por ejemplo, aqu mostrada como una perla de flotabilidad, de manera que el molde diana puede estirarse. Estos complejos de captura pueden ensamblarse tanto por auto-ensamblaje aleatorio de un mezcla estequiometricamente equilibrada de polfmeros funcionalizado en los extremos (ejemplo, tiol - PEG - hidrazida para la union de diana; tiol - PEG - metoxi para el encapuchado de la monocapa auto-ensamblada “SAM”) o por estampado de puntos de union reactivos espacialmente resueltos usando tecnicas litograficas. El metodo litografico estampado puede producir puntos de union diana consistentemente separados, aunque esto es diffcil de hacer para la union de una unica molecula, aunque el metodo de auto- ensamblaje aleatorio probablemente producina separacion de la union diana mas variable, pero tiene un alto porcentaje de uniones de moleculas individuales. Estan comercialmente disponibles un amplio intervalo de reticuladores monofuncionales, bifuncionales y heterobifuncionales de una variedad de fuentes. Tambien estan disponibles polfmeros monofuncionales, bifuncionales y heterobifuncionales compatibles de reticulante (polietilenglicol, poli-I-lisina) de una amplia variedad de fuentes comerciales.
La densidad de diana de ADN de 1 billon de dianas sobre una superficie de 100 cm2 requerina un promedio por area diana de 10 um2. La separacion diana en este intervalo proporciona separacion diana suficiente para prevenir la significativa reaccion cruzada de acidos nucleicos diana de 5000 bases de longitud anclados a perlas (diametro de perla 100-1000 nm; ADNbc de 5 Kb = 1700 um). El area diana puede expandirse facilmente si se determina que la reactividad cruzada de la diana y/o perla (>1 perla/diana) es inaceptablemente alta.
Alargamiento diana usando perlas o nanoparticulas
Como se muestra en la Figura 40, una perla o nanopartfcula (400) anclada sobre el extremo libre de ADN diana puede utilizarse para alargar y mantener la diana en su conformacion monocatenaria durante, por ejemplo, la hibridacion de bibliotecas de Xsonda. La retencion de la diana en una conformacion alargada reduce significativamente la frecuencia y estabilidad de las estructuras secundarias intramoleculares diana que se forman a las menores temperaturas. La reduccion o incluso eliminacion de las influencias de la estructura secundaria promueve el eficaz ensamblaje de construcciones de sustrato de alta fidelidad.
Puede emplearse una variedad de enfoques para aplicar una fuerza de alargamiento con la diana monocatenaria. Por ejemplo, perlas paramagneticas/nanopartfculas/polfmeros permiten el uso del campo magnetico para suministrar fuerza direccional controlada a la diana anclada a la superficie. Ademas, controlando la direccion de las lmeas de campo magnetico, pueden usarse perlas paramagneticas/partfculas para guiar y mantener la diana cargada con Xsonda sobre la superficie del sustrato durante las etapas de lavado. Secuestrando las dianas a lo largo de la superficie, puede minimizarse la perdida de diana debido a fuerzas de cizallamiento. Como alternativa al alargamiento del campo magnetico, pueden usarse perlas/partfculas de flotabilidad positiva y negativa que son tanto mas como menos densas que el agua, respectivamente, para proporcionar una fuerza de alargamiento. Todas las perlas/partfculas se recubren superficialmente segun sea necesario para minimizar interacciones no espedficas (agregacion de perlas, union a sondas) y se funcionalizan para permitir la reticulacion covalente con dianas modificadas con adaptador.
La Figura 41A a 41D ilustra estrategias de alargamiento de dianas basadas en perlas representativas. El alargamiento de dianas usando perlas paramagneticas/partfculas ancladas en los extremos atrafdas a un campo magnetico externo (B) se ilustra en la Figura 41A. El secuestro de diana sobre la superficie del sustrato (para reducir el cizallamiento diana) usando perlas paramagneticas/partfculas ancladas en los extremos atrafdas a un campo magnetico externo se ilustra en la Figura 41B. Las Figuras 41C y 41D ilustran el alargamiento de diana usando
5
10
15
20
25
30
35
40
45
50
55
perlas/partfculas de flotabilidad negativa ancladas en los extremos (mayor densidad que el agua) y perlas/partfculas de flotabilidad positiva (menor densidad que el agua), respectivamente. Los metodos de disolucion libre para el alargamiento de dianas usando restos anclados en el extremo, por ejemplo, usando tanto una perla de flotabilidad positiva como negativa para funcionalizar extremos opuestos de una diana, proporcionan una alternativa elegante para reducir la estructura secundaria de dianas.
El uso de estas estrategias de alargamiento en la preparacion de Xpandomeros se ilustra en la Figura 41E. Aqm, en la etapa I, el molde inmovilizado (416) se estira usando una perla flotante duplexada con la diana mediante el cebador de adaptamero (417). El molde se pone en contacto entonces en la etapa II con construcciones de sustrato y estas se enlazan entonces con la diana monocatenaria, produciendo un producto intermedio de Xpandomero bicatenario (411) con construccion de sonda-bucle caractenstica y dos esqueletos, uno mediante el esqueleto primario del polinucleotido y el otro mediante el esqueleto de Xpandomero limitado. En la etapa III, la hebra molde se desnaturaliza, y en la etapa IV el producto intermedio de Xpandomero monocatenario se escinde en enlaces selectivamente escindibles en el esqueleto primario, produciendo un desplegamiento de los bucles y alargamiento del producto de Xpandomero con esqueleto sustituto completamente extendido (419).
Alargamiento de dianas de ADN usando modificaciones de extremos del polimero
Una alternativa a los metodos descritos en la Figura 40 utiliza polfmeros funcionalizados largos (en lugar de perlas) ligados covalentemente en los extremos libres de dianas de aDn ancladas en la superficie para alargar la diana. El electro-estiramiento y el bobinado de modificaciones de extremos del polfmero a traves de sustrato poroso seguido por captura (secuestro) de polfmero dentro del sustrato produce ADN diana monocatenario completamente alargado significativamente libre de estructura secundaria. La Figura 42A ilustra este metodo, que muestra el bobinado de las hebras de diana a traves de poros en un sustrato. Los sustratos porosos incluyen, pero no se limitan a, matriz de gel, oxido de aluminio poroso y membranas porosas. La captura de polfmero completamente alargado puede lograrse por funcionalizacion qrnmica controlada en la que la reticulacion o union de polfmero a sustrato poroso puede iniciarse selectivamente despues del alargamiento completo de la diana. Estan disponibles una variedad de estrategias de reticulacion o union. Por ejemplo, la reticulacion de polfmero alargado funcionalizado con carboxilo a sustrato poroso funcionalizado con amina puede lograrse con la introduccion del agente de reticulacion clorhidrato de 1-etil-3-[3-dimetilaminopropil]carbodiimida (EDC).
Otra realizacion se ilustra en la Figura 42B, es electroestirar el polfmero hacia una superficie funcionalizada que reticula o se une al polfmero. En este caso, el polfmero no esta necesariamente bobinado a traves del sustrato, sino que en su lugar se reticula o se une a grupos funcionales sobre la superficie. Para este enfoque, los sustratos incluyen, pero no se limitan a, matriz de gel, oxido de aluminio poroso, membranas porosas y superficies conductoras no porosas como oro. Tanto los sustratos porosos como no porosos pueden funcionalizarse usando una variedad de qrnmicas de reticulacion (hidrazida-aldehfdo; oro-tiol) o de union (biotina-estreptavidina) listas para uso.
Como alternativa, puede emplearse un sistema de apertura electrica encerrada que usa regiones de campo electrico variables (alta, baja, tierra) para capturar segmentos de polfmero cargados. El metodo, que se ilustra en la Figura 42C, produce una tipo de jaula de Faraday de cierre que puede usarse para mantener el polfmero y ADN diana en su posicion alargada. Este enfoque requiere el reparto o confinamiento eficaz de campos electricos, y tiene la ventaja de permitir el alargamiento de dianas ajustable (durante toda la smtesis de SBX) modificando los parametros de apertura. Fuera de la jaula de Faraday, las influencias de campos electricos sobre las construcciones de sustrato son mmimas.
En un metodo relacionado, se usa un polfmero elastico para suministrar una fuerza de estiramiento constante al acido nucleico diana menos elastico. Este metodo puede usarse como suplemento a cualquiera de los metodos de alargamiento descritos aqm, que incluyen perla magnetica, deformacion de la flotabilidad, deformacion de la densidad (gravedad), o electroestiramiento. La fuerza elastica almacenada dentro del polfmero proporciona una fuerza de alargamiento amortiguada mas coherente con la hebra diana.
Sustrato diana basado en matriz de gel con electro-enderezamiento
En la Figura 43A se muestra un metodo alternativo para la presentacion de ADN diana monocatenario (frente a la union a soporte solido) en el que la diana esta covalentemente unida a una matriz de gel de tamizado (430). En la Figura 43b (insercion), puede observarse que las construcciones de sustrato se asocian con los moldes anclados, que se han estirado rectos. Pueden usarse campos electricos para el alargamiento de dianas y la presentacion de construcciones de sustrato. Este enfoque tiene ventajas con respecto a otros metodos para la matriz de diana de ADN en terminos de densidad de diana y alargamiento de dianas (electro-enderezamiento). Por ejemplo, la reticulacion de ADN a acrilamida mediante ada^tadores de extremos modificados con acrilato (unidos a oligonucleotidos) se hace rutinariamente. Acrydite es un fosforamidito disponible (Matrix Technologies, Inc., Hudson, NH, EE.UU.) que se ha usado ampliamente para incorporar modificaciones del extremo 5' de metacrilo a oligonucleotidos: el doble enlace en el grupo Acrydite reacciona con dobles enlaces activados de acrilamida (Kenney et al., “Mutation typing using electrophoresis and gel-immobilized Acrydite probes”, Biotechniques 25(3):516-21, 1998). La agarosa funcionalizada con amina tambien esta disponible lista para uso (G Biosciences, St. Louis, MO,
5
10
15
20
25
30
35
40
45
50
55
EE.UU.) y puede usarse similarmente para reticularse con ADN usando qmmicas de reticulacion reactivas con amina listas para uso (Spagna et al., “Stabilization of a p-glucosidase from Aspergillus niger by binding to an amine agarose gel”, J. of Mol. Catalysis B: Enzymatic 11 (2,3): 63-69, 2000).
Al igual que con los metodos de union de soporte solido previamente descritos, los fragmentos de ADN se funcionalizan utilmente con adaptadores de extremos para producir, por ejemplo, una modificacion de 5'-Acrydite. Para garantizar la uniformidad de dianas, las dianas de ADNbc se desnaturalizan (y se mantienen en un estado desnaturalizado) mientras que se reticulan con la matriz de tamizado. La diana puede desnaturalizarse usando una variedad de tecnicas existentes que incluyen, pero no se limitan a, urea, pH alcalino y fusion termica. Una vez se ha reticulado con una matriz de gel, el ADN diana desnaturalizado puede enderezarse aplicando un campo electrico apropiado (similar a la electroforesis). La difusion, electroforesis y neutralizacion de los desnaturalizantes dentro de la matriz de gel junto con un estrecho control de temperatura, con la adicion de disoluciones compatibles con la hibridacion, produce un entorno propicio para la hibridacion de construcciones de sustrato. Por ejemplo, pueden presentarse continuamente Xsondas a dianas ancladas por electroforesis. Este formado permite el reciclado de sondas y proporciona un buen control con respecto a la velocidad de flujo de Xsondas.
La densidad de dianas de una serie de matrices de gel de 5 mm x 50 mm x 20 mm produce un volumen reactivo de 5,0 x 1012 pm3, que es sustancialmente superior a lo que puede presentarse sobre una superficie plana. La Figura 43C muestra las estructuras qmmicas para acilamida, bis-acrilamida, y la modificacion de extremos de oligonucleotidos con Acrydite. La Figura 43D ilustra una matriz de gel de poliacrilamida con diana de ADN covalentemente unida.
El procesamiento enzimatico de construcciones de sustrato puede hacerse dentro de la matriz de gel. Ensayos enzimaticos que usan polimerasas (PCR) y ligasas se usan rutinariamente para la modificacion de oligonucleotidos covalentemente acopladas a almohadillas de gel de acrilamida (Proudnikov et al., “Immobilization of DNA in Polyacrylamide Gel for the Manufacture of DNA and DNA-Oligonucleotide Microchips”, Analytical Biochemistry 259(1): 34-41, 1998). La ligasa, por ejemplo, se suministra a dianas de Xsonda ensambladas dentro de la matriz de gel tanto por difusion pasiva, electroforesis, como una combinacion de ambas. Se consideran un amplio intervalo de densidades de matriz y tamanos de poro, sin embargo, la difusion pasiva se beneficia de matriz de densidad relativamente baja y poros grandes. El suministro activo de ligasa por electroforesis puede lograrse por union de modificadores de la carga (polfmeros y dendnmeros) a la enzima para potenciar su migracion a traves de la matriz.
Una variacion del metodo de matriz de gel es someter a electroforesis los polinucleotidos diana monocatenarios modificados en los extremos a traves de una matriz de gel. Las modificaciones de extremo pueden usarse para crear arrastre sobre un extremo de la diana. Puede realizarse una modificacion de extremo cationica en el otro extremo de la diana de manera que la arrastre mediante el gel. Tambien puede inducirse un gradiente o zona de temperatura en el gel de manera que se rampee o module la rigurosidad de hibridacion a medida que las dianas progresan a traves de la matriz de gel. Puede hacerse procesamiento enzimatico dentro de la matriz de gel o despues de que los complejos hibridados de diana-sustrato salgan de la matriz de gel. El proceso pueden repetirse segun sea necesario para producir la longitud de Xpandomero promedio deseada.
La Figura 44 ilustra el uso de marcas de arrastre para la post-smtesis de manipulacion de Xpandomeros. La marca de arrastre (representada como un diamante) sirve de equivalente de disolucion de una tecnica de estiramiento y transporte (Meagher et al., “Free-solution electrophoresis of DNA modified with drag-tags at both ends”, Electrophoresis 27(9):1702-12, 2006). En la Figura 44A, las marcas de arrastre estan unidas por qmmica de conectores a adaptadores funcionalizados sobre los extremos 5' del molde monocatenario (L1' de la marca de arrastre se combina con L1 del molde). En la etapa mostrada, la adicion procesiva de construcciones de sustrato se muestra ya en progreso. En la Figura 44B, la marca de arrastre se anade hibridando con un adaptador complementario. En la Figura 44C, el Xpandomero se trata primero de manera que se una un conector a un adaptador de 3' (mostrado como el cuadrado pequeno con L1'), y entonces el conector (L1) se usa en la etapa II para unir la marca de arrastre al mismo. La transferasa terminal, que extiende un extremo 3'-OH de ADN mono o bicatenario, polimeriza los trifosfatos de nucleotido modificados por conector tales como nucleotidos biotinilados. Tambien pueden usarse otras enzimas para anadir bases u oligomeros modificados. En la Figura 44C, una marca de arrastre se anade al extremo 3' del producto intermedio de Xpandomero. Las marcas de arrastre pueden incluir, pero no se limitan a, nanopartfculas, perlas, polfmeros, polfmeros ramificados y dendnmeros.
Huecos y llenado de huecos con hibridacion y ligacion de construcciones de sustrato
Pueden emplearse multiples variantes en los metodos de ligacion para tratar la gestion de huecos y el llenado de huecos. En una realizacion, se usa ligacion escalonada cfclica, en la que sondas se ensamblan secuencialmente de un cebador anclado en la superficie duplexado con el polinucleotido diana. En otra realizacion, se producen hibridacion y ligacion “promiscua” de construcciones de sustrato simultaneamente a traves de toda la secuencia de ADN diana entera, generalmente sin un cebador.
Para tanto los enfoques de ligacion cfclica como promiscua, es posible que, por ejemplo, alguna porcion de las construcciones de sustrato 4meras (por ejemplo, el 25 %) y alguna porcion de las construcciones de sustrato 5meras (por ejemplo, el 20 %) se hibride adyacentemente de manera que se permita la ligacion. De estos duplex
5
10
15
20
25
30
35
40
45
50
55
adyacentes, algun porcentaje puede contener secuencias desapareadas que produciran tanto error de medicion (si estan ligadas) como fallo al ligarse. La mayona de los casos del fallo de la ligacion (debido a desapareamiento) es sin consecuencia, ya que las sondas sin ligar se eliminan antes de la siguiente ronda de hibridacion. El ciclo de hibridacion / lavado / ligacion / lavado puede repetirse varios cientos de veces, si se desea (6 minutos/ciclo = 220 ciclos/dfa y 720 ciclos/3 dfas; 10 minutos /ciclo = 144 ciclos/dfa y 432 ciclos/3 dfas).
En el proceso dclico (ilustrado con Xsondas en la Figura 14), las Xsondas se ensamblan secuencialmente desde un extremo de un cebador anclado en la superficie duplexado con el ADN diana; una Xsonda por ciclo. Si esto es el caso, la longitud de lectura diana puede calcularse usando las siguientes suposiciones: el 25 % de hibridacion adyacente (de 4 meros) con el 20 % de fidelidad de duplex de sonda perfecto producina solo 20 ligaciones de 4meros secuenciales (400 x 25 % x 20 %) despues de 400 ciclos. Usando estas suposiciones, un ensayo de 400 ciclos (1,5 dfas a 6'/ciclo) producina una longitud de producto promedio de 80 nucleotidos.
En el proceso promiscuo (ilustrado con Xsondas de clase I en la Figura 45), si se deja que las reacciones de hibridacion y ligacion de Xsondas se produzcan espontaneamente y simultaneamente a lo largo del molde diana de ADN, puede lograrse la replicacion de un molde de ADN mucho mas largo usando muchos menos ciclos. Tras cada ciclo de hibridacion y lavado, puede usarse ligacion para conectar los duplex restantes que son tanto adyacentes como el 100 % correctos. Puede usarse otro lavado mas riguroso para eliminar productos de ligacion mas pequenos (todos 8meros y menos; algunos 12meros), ademas de todos los 4meros sin ligar. Con reacciones de ligacion que se producen durante toda la secuencia diana de 1.000-10.000 nucleotidos, la procesividad del ensayo aumenta espectacularmente. Como el enfoque promiscuo para la hibridacion y ligacion de Xsondas es independiente de la longitud del molde diana de ADN, la mayona del molde diana puede replicarse en una fraccion de los ciclos requerida para el metodo en serie. Pueden usarse tiempos de ciclo mas largos para compensar limitaciones cineticas si un ajuste tal aumenta la fidelidad y/o cantidad de reacciones de hibridacion/ligacion.
La Figura 45 ilustra una progresion secuencial del proceso promiscuo. La etapa I ilustra la hibridacion de Xsondas 4meras en multiples loci a lo largo de la diana de ADN. La etapa II ilustra la hibridacion y ligacion de Xsondas adyacentes; las Xsondas ligadas se estabilizan y asf siguen hibridadas aunque las Xsondas sin ligar se fundan. La etapa III y la etapa IV ilustran otro ciclo de hibridacion termico seguido de ligacion y fusion termica de Xsondas sin ligar. Cada ciclo extiende preferencialmente las cadenas de Xsondas ligadas existentes. Como se ilustra en la etapa IV, despues de ciclos repetidos, la diana de ADN se satura con Xsondas que dejan huecos, mas cortos que una longitud de sonda, en los que no se ha producido duplexado. Para completar el Xpandomero, las Xsondas se enlazan a traves de los huecos por medios enzimaticos o qrnmicos como se ilustran en la etapa V.
Llenado de huecos estandar
Como se ilustra con Xsondas en la etapa V de la Figura 45, despues de completarse el proceso de ciclos de hibridacion y ligacion, los huecos de secuencia pueden llenarse para producir un Xpandomero continuo. Los huecos a lo largo del esqueleto de ADN diana pueden llenarse usando procesos de llenado de huecos basados en ADN polimerasa/ligasa bien establecidos (Stewart et al., “A quantitative assay for assessing allelic proportions by iterative gap ligation”, Nucleic Acids Research 26(4):961-966, 1998). Estos huecos se producen cuando cadenas de Xsondas adyacentes se encuentran las unas con las otras y tienen una longitud de huecos de 1, 2 o 3 nucleotidos entre ellas (suponiendo una Xsonda de clase 1 4mera como se ilustra en la Figura 45). El llenado de huecos tambien puede hacerse mediante reticulacion qrnmica (Burgin et al.). Despues de completarse el llenado de huecos, puede procesarse el complemento de ADN diana, que esta compuesto principalmente de Xsondas ligadas con cargas periodicas de 1, 2 o 3 nucleotidos (purificacion, escision, modificacion de extremo, marcado de indicador) segun convenga para producir un Xpandomero medible. Como los productos de ensayo de SBX se preparan y se purifican en procesamiento por lotes antes de la etapa de deteccion, la deteccion es eficaz y no esta limitada por ningun procesamiento bioqmmico simultaneo.
Con el fin de diferenciar los huecos de la senal de indicador espedfica de nucleotido, pueden usarse desoxinucleotido trifosfatos modificados (que tanto ya esta marcados como son capaces de ser marcados tras el ensayo) para identificar la secuencia de huecos. Desoxinucleotido trifosfatos adecuados se ilustran en las Figuras 46A (bases modificadas con conector) y 46B (bases modificadas con biotina).
La longitud y frecuencia de huecos dependen de varias variables de smtesis, que incluyen numero de ciclos, rigurosidad de hibridacion, estrategia de bibliotecas (de secuenciacion aleatoria frente a sub-biblioteca con ajuste estequiometrico), longitud de molde diana (100b -1 Mb) y densidad de reaccion (0,1-10 B). La frecuencia de huecos y la longitud de huecos pueden reducirse significativamente utilizando condiciones de rigurosidad maximas, siempre que las condiciones sean compatibles con el intervalo de tiempo de ensayo especificado. La longitud de diana y la densidad de reaccion tambien son factores importantes con respecto a tanto la fidelidad del alineamiento como la probabilidad de llenado de huecos.
El proceso promiscuo de hibridacion puede usar metodos de ciclado termico para mejorar la rigurosidad de hibridacion y para aumentar la frecuencia de alineamientos de construcciones de sustrato adyacentes. La hibridacion, ligacion y la fusion termica continuan bajo un ciclado termico preciso rutinario hasta que la mayona de la secuencia diana se duplexa con sonda. Los duplex de sonda-diana no espedficos debilmente unidos pueden
5
10
15
20
25
30
35
40
45
50
55
60
eliminarse por una simple etapa de lavado, de nuevo bajo control termico preciso. La ligacion enzimatica o qmmica puede realizarse para enlazar cualquier construccion oligomerica adyacentemente hibridada a lo largo del ADN diana, generando secuencias mas largas y mas estabilizadas. La ligacion enzimatica tiene el beneficio anadido de proporcionar una comprobacion cruzada de fidelidad del duplex de adicion, ya que la sonda-dianas desapareadas no estan eficazmente ligadas. Usando un segundo lavado bajo condiciones de ciclo termico preciso, las construcciones de sustrato sin ligar pueden fundir el esqueleto de ADN; quedaran productos intermedios mas largos. Las secuencias ligadas mas largas crecen en multiples loci a lo largo del ADN diana hasta que la replicacion este practicamente completa. El proceso de hibridacion/lavado/ligacion/lavado se repite de cero a muchas veces hasta que la mayona de molde diana se ha replicado.
El ciclado de temperatura acoplado con la estabilizacion de la construccion de sustrato debido al apilamiento de bases puede utilizarse para enriquecer en acontecimientos de hibridacion adyacentes. Las condiciones de ciclado termico, similares en concepto a la “PCR con rampa decreciente de temperatura”, pueden usarse para eliminar duplex no adyacentes menos estables. Por ejemplo, ciclando repetitivamente entre la temperatura de hibridacion y la temperatura de fusion superior (“Tm”) calculada para la biblioteca de oligos (como se determina por fusion de sonda individual - es decir, no apilamiento de bases estabilizado) pueden seleccionarse positivamente acontecimientos de hibridacion de sondas adyacentes. Con eficiencia de enriquecimiento suficiente, el numero de ciclos puede reducirse significativamente. Esto puede realizarse en condiciones de un bano unico o de multi-bano.
Con un tamano de biblioteca pequeno (256 construcciones de sustrato 4meras, por ejemplo), la biblioteca puede repartirse en sub-bibliotecas basandose en un intervalo de temperatura de fusion incluso mas estrecho. Esta estrategia puede beneficiarse significativamente del metodo si el sesgo de Tm no puede controlarse mediante la modificacion de bases, adyuvantes de disolucion de hibridacion, y similares. Ademas, la estequiometna de la sonda puede ajustarse (por arriba o por abajo) para compensar cualquier sesgo residual que todavfa pueda existir en la biblioteca/sub-bibliotecas.
Se realizo modelado informatico para evaluar la estadfstica de la aparicion de huecos y las longitudes de construcciones de sustrato consecutivamente conectadas que se hibridan sobre un molde de ADN diana. El modelo simula un ciclo termico de hibridacion/ligacion con una biblioteca completa de 256 Xsondas 4meras. Los resultados del modelo que se presentan aqrn se basan en el siguiente proceso modelo:
i) La etapa de hibridacion/ligacion simula Xsondas 4meras aleatorias que cumplen un molde de ADN aleatoriamente secuenciado en posiciones aleatorias y que se hibridan si se aparean. Ninguna Xsonda puede solapar ningun nucleotido. La hibridacion continua hasta que todas las localizaciones en la diana se hibridan mas de 3 nucleotidos de longitud.
ii) La etapa de fusion termica se simula eliminando todas las Xsondas que son en cadenas mas cortas de M Xsondas 4meras de longitud (en la que m = 2, 3, 4, 5 ...). Las cadenas mas largas siguen sobre el molde de ADN. Una “Cadena” se define aqrn como multiples Xsondas consecutivas sin huecos entre ellas.
iii) Repetir el ciclo definido por i) y ii) de manera que se construyan Xsondas a partir de los loci existentes de cadenas de multi-Xsonda. El ciclado se detiene cuando no se produce cambio entre 2 ciclos consecutivos.
La Figura 47 y la Figura 48 tienen cada una dos graficos que ilustran la estadfstica de ejecutar el modelo 100 veces en un molde de ADN aleatorio. Para fines de procesamiento, la diana de ADN se eligio para tener 300 nucleotidos de longitud (pero la estadfstica aqrn tratada no se cambia si la longitud del molde es 5000 nucleotidos). La Figura 47 muestra los resultados para M = 3, en la que cadenas mas cortas de M=3 “funden” el molde de ADN. La Figura 47A muestra la estadfstica de las longitudes de cadena en el ultimo ciclo. La distribucion parece ser casi exponencial oscilando de 12mero (M = 3) hasta algunos 160meros largos con una media de ~28 nucleotidos de longitud. La Figura 47B muestra que se necesita un intervalo de 5 a 20 ciclos para completar el molde de ADN usando este metodo de “crecimiento” de cadena y que el 90 % de las ejecuciones se completan despues de 12 ciclos. Las Figuras 48A y 48B muestran el mismo tipo de informacion para el caso en el que M=4, una fusion termica mas rigurosa. En este caso, la longitud promedio de cadena aumenta a ~40 nucleotidos, pero requiere ~ 18 ciclos para completar el 90 % de las ejecuciones. Las longitudes de cadena mas largas reducen la probabilidad de tener un hueco como era de esperar. La probabilidad media de no llenar una posicion de nucleotido para estos datos de M = 4 tiene una media de 0,039 (aproximadamente 1 en 25).
Llenado de huecos con construcciones de sustrato 3meras y 2meras
Una extension de la realizacion de hibridacion 4mera basica es usar construcciones de sustrato 3meras y 2meras para llenar los huecos de secuencia de 3 bases y 2 bases, respectivamente. La Figura 49 muestra un ejemplo de llenado de huecos por adicion secuencial o simultanea de Xsondas mas cortas. Si la mayona del molde diana se duplexa satisfactoriamente con Xsondas tras la hibridacion 4mera, la mayona de los huecos restantes tienen tanto 1, 2 como 3 bases de longitud. El tamano promedio del Xpandomero puede aumentarse significativamente si puede llenarse un porcentaje de moderado a alto de los huecos de 2 y 3 bases y ligarse con Xsondas mas pequenas. Como la hibridacion de estas sondas mas pequenas se hace despues de duplexarse la mayor parte de la diana, la rigurosidad de temperatura puede reducirse para permitir el duplexado de 3meros y luego 2meros, respectivamente. La estabilidad del duplex de las Xsondas mas pequenas aumenta debido a la estabilizacion por apilamiento de bases. Tras la ligacion, los huecos restantes se llenan usando una polimerasa para insertar nucleotidos, seguido de
5
10
15
20
25
30
35
40
45
50
55
nuevo por ligacion para enlazar todos los 5'-fosfatos y 3'-hidroxilos adyacentes restantes. Los nucleotidos modificados con conector incorporado en polimerasa permiten el marcado de huecos, tanto antes como despues de la incorporacion. Estas marcas pueden o no pueden identificar la base. Basandose en modelos estad^sticos, resumidos en los diagramas de la Figura 50, los polfmeros de Xpandomero de longitud completa tienen mas del 95 % de cobertura de la secuencia diana (superior a 16 bases). Segun el modelo, el uso de llenado de huecos de sondas 3meras/2meras hace bajar el porcentaje de bases sin marcar un factor de 6 (suponiendo incorporacion de alta eficiencia), que, para una secuencia diana de 5000 bases, producina 5000 bases de secuencia principalmente contigua con menos de 50 huecos de bases individuales sin discriminar a traves de todo el replicon dina. Como tal, se identifica a 16X cobertura superior al 99 % de las secuencias de hueco sin identificar.
El llenado de huecos con estas Xsondas 3meras y 2meras mas pequenas, por ejemplo, extiende la longitud del Xpandomero promedio tres veces. Los diagramas que resumen los resultados de modelado estadfstico como se muestra en las Figuras 50A y 50B indican que los Xpandomeros de huecos rellenos 3meros/2meros de longitud promedio, bajo las condiciones descritas, estan en el intervalo de 130 bases de secuencia. Ademas, con 5000 gigabases de secuencia de Xpandomero sintetizada de este modo, que es el equivalente a convertir solo 2,5 ng de secuencia diana en Xpandomero, la seleccion de tamano del 10 % mas largo de fragmentos de Xpandomero de esa poblacion producina 500 gigabases de secuencia con longitudes promedio en el intervalo de 381 bases, aunque la seleccion de tamano del 2 % mas largo de fragmentos de Xpandomero producina 100 gigabases de secuencia con longitudes promedio en el intervalo de 554 bases. Estas longitudes de fragmento pueden lograrse sin la necesidad de llenado de huecos de bases individuales con polimerasa. Si se hace hibridacion de Xsondas 4meras sin ningun llenado de huecos, los modelos estadfsticos indican que las longitudes promedio para el 10 % y 2 % mas largos de los fragmentos senan 106 y 148 bases, respectivamente.
Adicion de adyuvantes para reducir la estructura secundaria diana
El ADN diana monocatenario anclado en la superficie largo puede presentar un diana de hibridacion desafiante debido a estructuras secundarias intramoleculares. La adicion de una perla anclada en los extremos, como se describe en la Figura 41E, reduce la aparicion de estas formaciones intramoleculares, y las desestabiliza cuando se producen. Sin embargo, puede encontrarse necesario disminuir adicionalmente la formacion de estructuras secundarias, que puede bloquear eficazmente la hibridacion de construcciones de sustrato, con la adicion de adyuvantes.
La adicion de sondas de oligonucleotidos 2meras y/o 3meras sin marcar a, por ejemplo, una mezcla de hibridacion de Xsondas puede servir para este fin. Para eliminar la posibilidad de incorporacion en el Xpandomero, estas sondas se sintetizan para ser no ligables (sin 5'-fosfato o 3'-hidroxilo). Debido a su pequeno tamano, no es probable que los adyuvantes 2meros y/o 3meros formen duplex estables a las temperaturas de hibridacion de Xsondas 4meras; sin embargo, su presencia en la mezcla de reaccion a concentraciones de moderadas a altas reduce la frecuencia y estabilidad de la estructura secundaria diana bloqueando debilmente y transitoriamente el acceso de secuencias de nucleotidos intramoleculares que pueden de otro modo duplexarse. La Figura 51 es una ilustracion de como la adicion de adyuvantes 2meros o 3meros inhibe la formacion de estructuras secundarias (para simplicidad solo, en la figura no se mostraron Xsondas 4meras). Acoplado con la fuerza de alargamiento proporcionada por el anclaje de perlas, los adyuvantes disminuyen significativamente la frecuencia de formacion de estructuras secundarias.
Estos adyuvantes de dinucleotido y/o trinucleotido pueden estar compuestos de nucleotidos estandar, nucleotidos modificados, nucleotidos universales (5-nitroindol, 3-nitropirrol y desoxiinosina), o cualquier combinacion de los mismos, para crear todas las combinaciones de secuencia necesarias. La Figura 52 muestra sustituciones de bases universales comunes que se usaron para este fin.
Otro enfoque para reducir la estructura secundaria diana es replicar ADN diana para producir una diana de ADNc sintetico que tiene una estabilidad de estructura secundaria reducida en comparacion con ADN nativo. La Figura 53 enumera algunos analogos de nucleotidos, como se ilustra en la solicitud de EE.UU. 2005/0032053 (“Nucleic acid molecules with reduced secondary structure”), que pueden incorporarse en la diana de ADNc sintetica descrita. Se ha demostrado que estos analogos, que incluyen (pero no se limitan a) N4-etildesoxicitidina, 2-aminoadenosina-5'- monofosfato, 2-tiouridina-monofosfato, inosina-monofosfato, pirrolopirimidina-monofosfato y 2-tiocitidina- monofosfato, reducen la estructura secundaria de ADNc. Este enfoque puede usarse junto con alargamiento de dianas y adyuvantes de hibridacion para reducir la estructura secundaria.
Deteccion y medicion
Como se ha mencionado previamente, el Xpandomero puede marcarse y medirse por cualquier numero de tecnicas. El potencial de salida masiva de datos del metodo de SBX coindice bien con las matrices de sensor basadas en nanoporos o tecnologfas equivalentes. En una realizacion, la matriz de nanoporos puede servir de fuente de ionizacion sobre el extremo delantero de un espectrometro de masas, en el que los codigos de indicador sobre el Xpandomero son marcas de espectroscopfa de masas escindibles. Otras realizaciones implican el uso de un sensor de nanoporos tal como impedancia electrica/conductancia o FRET.
5
10
15
20
25
30
35
40
45
50
55
60
Una realizacion de deteccion usa una matriz de nanoporos como se representa en la Figura 54. En esta realizacion, el Xpandomero se ensambla usando metodos descritos previamente, excepto que la diana de ADN no esta anclada a un soporte solido inmovilizado, sino que esta anclada a una perla magnetica que tiene su sonda de anclaje bobinada a traves de un sustrato de nanoporo. Ademas, un multitud de fluoroforos donantes de FRET, para dos longitudes de onda de excitacion, estan anclados con la entrada del nanoporo (mostrada como pequenos cuadrados). Los fluoroforos aceptores de FRET constituyen los indicadores incorporados sobre el Xpandomero. Despues de escindirse las Xsondas ligadas del Xpandomero, el Xpandomero se estira por una fuerza que puede ser electrostatica, magnetica, gravitacional y/o mecanica y puede facilitarse por la perla usada para extender la diana de ADN original (mostrada unida con la parte superior del Xpandomero). En la etapa de medicion final, el Xpandomero se saca a traves del nanoporo aplicando una fuerza magnetica sobre la perla magnetica mostrada debajo de la estructura de nanoporo. Los fluoroforos donantes en la entrada del nanoporo se excitan con una fuente de luz (X1) y como los indicadores pasan proximales con los fluoroforos donantes, se excitan y emiten su fluorescencia distintiva (X2) que descodifica la secuencia de nucleotidos asociada.
La Figura 54 tambien ilustra una realizacion de codificar la secuencia en los codigos de indicador. Sobre cada anclaje hay 4 sitios de indicador, cada uno cargado con una combinacion de dos tipos de fluoroforo aceptor de FRET. Esto proporciona cuatro estados medibles sobre cada sitio usando nivel de intensidad relativa. Si la fluorescencia de fluoroforos aceptores fuera roja y verde, la codificacion de estos estados con los 4 nucleotidos puede ser: A: verde>roja, C: solo roja, G: solo verde y T: roja > verde.
En otra realizacion, el Xpandomero se marca con indicadores de marca de masa que se miden usando un espectrometro de masas. El Xpandomero se dosifica en un capilar estrecho que alimenta los indicadores secuencialmente en un ionizador de electropulverizacion. Para permitir la medicion del espectrometro de masas de los indicadores de marca de masa discretos, las marcas de masa pueden ser fotoescindidas del andamiaje de indicador justo antes de, durante, o despues de la ionizacion de la marca de masa. Puede usarse espectrometro de masas basado en sector magnetico, cuadrupolo, o tiempo de vuelo (“TOF”) para la deteccion de marcas de masa. El instrumento solo requiere distinguir un numero limitado de marcas de masa separada. Esto puede usarse para mejorar la sensibilidad y rendimiento del instrumento. Por tanto, el empleo de un instrumento que tiene multiples canales para realizar la ionizacion y deteccion en paralelo aumenta el rendimiento en ordenes de magnitud.
Una realizacion de deteccion del enfoque de espectrometro de masas es un detector de masas de TOF multi-canal que puede leer >100 canales simultaneamente. Un instrumento adecuado usana una fuente de ionizacion multicanal que alimenta Xpandomero en multiples canales a una concentracion y tasa que maximiza el uso del canal, maximizando asf la tasa de salida de datos de buena calidad. Una fuente de ionizacion tal requiere tener separacion adecuada de los segmentos de indicador de marca de masa. Las marcas de masa pueden ser fotoescindidas a medida que surgen de un nanoporo y se ionizan. Los requisitos de dispersion no son altos, de manera que un corto tubo de vuelo es todo lo que se requiere. La salida de medicion extremadamente alta es posible con un enfoque de deteccion de espectrometro de masas multi-canal. Por ejemplo, una matriz de 100 canales de iones de nanoporo que lee a la tasa de 10.000 codigos de indicador por segundo (con 4 mediciones de nucleotido por codigo de indicador) lograna un rendimiento del instrumento de > 4 Mbases/segundo.
En otra realizacion, el nanoporo se usa de un modo similar a un contador Coulter (Figura 55). En esta implementacion, la densidad de carga del Xpandomero esta disenada para ser similar a la del ADN nativo. Los indicadores estan disenados para producir 3 niveles de impedancia como se mide en, por ejemplo, el detector de nanoporos. Los Xpandomeros se presentan en una disolucion libre que tiene altas concentraciones de electrolito, tales como KCI 1 M. El nanoporo tiene 2 a 15 nm de diametro y tiene 4 a 30 nm de longitud. Para lograr buena resolucion de las marcas de construcciones de anclaje, se eligen para estar proximas a la misma longitud o mas largas. El diametro de las marcas puede ser diferente para los 3 niveles. El segmento de Xpandomero cerca de los enlaces de la construccion de anclaje no tiene indicadores (por ejemplo, PEG), este segmento tendra un nivel de impedancia particular. Uno de los tres niveles de indicador puede ser equivalente. Pueden producirse diferentes distintivos de impedancia, que implican tanto el nivel de impedancia como la respuesta temporal, variando las longitudes de segmento, densidad de carga y densidad molecular. Por ejemplo, para lograr 3 niveles de impedancia diferentes, los segmentos de construcciones de anclaje marcadas pueden codificarse qmmicamente para acoplarse a uno de tres tipos de polfmero diferentes, cada uno con una longitud y densidad de carga diferente.
Cuando el Xpandomero pasa a traves del detector de nanoporos, la corriente se modula segun que tipo de marca este presente. La cantidad de polfmero cargado que reside en el nanoporo afecta a tanto la corriente de especies de electrolitos como a la velocidad de translocalizacion.
La deteccion basada en polfmeros por nanoporos se demuestra en las patentes de EE.UU. N° 6.465.193 y 7.060.507, por ejemplo, y como era de esperar se muestra que los parametros ffsicos de un polfmero modulen la salida electrica de un nanoporo.
En otra realizacion de un aparato de deteccion basado en nanoporos (Figura 56), los electrodos laterales fijados con el nanoporo se usan para medir la impedancia o conductividad de lado a lado en el nanoporo, aunque se aplica un voltaje a traves de la pelfcula de soporte solido. Esto tiene la ventaja de separar la funcion de translocalizacion de la funcion de impedancia. A medida que el Xpandomero es transportado a traves del nanoporo, de nuevo se mide la
5
10
15
20
25
30
35
40
45
50
55
modulacion de corriente. Se emplean tecnicas microflmdicas y de micropipeteado, junto con marcas de arrastre, perlas magneticas, tecnicas de estiramiento electroforetico, etc., con el fin de transportar el Xpandomero a traves del nanoporo. Por ejemplo, la electroforesis en disolucion libre marcada en los extremos, tambien llamada ELFSE, es un metodo de rotura del equilibrio de la carga con respecto a la friccion de ADN de arrastre libre que puede usarse para la electroforesis de Xpandomeros en disolucion libre (Slater et al., “End-labeled free-solution electrophoresis of DNA”, Electrophoresis 26: 331-350, 2005).
Los metodos de anclaje, estiramiento, marcado y medicion de fragmentos grandes de ADN estan bien establecidos (Schwartz et al., “A single-molecule barcoding system using nanoslits for DNA analysis”, PNAS, 104(8):2673-2678, 2007; y Blanch et al., “Electrokinetic Stretching of Tethered DNA”, Biophysical Journal 85: 2539-2546, 2003). Sin embargo, la resolucion de nucleobases individuales para los fines de secuenciacion del genoma completo de acidos nucleicos nativos esta mas alla de las capacidades de estas tecnicas. En la Figura 57 a 59 se representan varios metodos de deteccion de Xpandomero de “molecula individual”. En la Figura 57 se representa un microscopio y cualquiera de una variedad de tecnicas de obtencion de imagenes directas que se aprovechan de la mayor resolucion espacial de la estructura del Xpandomero que puede concebirse. Una molecula de Xpandomero se coloca plana sobre una superficie generalmente plana y se escanea a lo largo de su longitud. Ejemplos incluyen microscopfa optica y microscopfa de fluorescencia. El uso de microscopfa de alta resolucion esta limitado en la mayona de los casos a >100 nm de resolucion que todavfa es posible con anclajes largos (100 nm por indicador, por ejemplo). Puede lograrse mayor resolucion (que requiere anclajes <100 nm por indicador, por ejemplo) usando tecnicas tales como microscopfa de fluorescencia de reflexion interna total (TlRF: Starr, T.E. et.al., Biophys. J. 80, 1575-84, 2001), grnas de onda de modo cero (Levine M.J. et al., Science 299, 682-85, 2003) o microscopfa optica de campo cercano (NSOM: de Lang et al., J. Cell Sci. 114, 4153-60 2001) o microscopfa de barrido laser confocal. En el caso de FRET localizada, las interacciones de excitacion pueden localizarse a < 10 nm, conduciendo a longitudes de anclaje de ~10 nm/indicador.
La deteccion y analisis de grandes moleculas de ADN por microscopfa electronica esta bien establecida (Montoliu et al., “Visualization of large DNA molecules by electron microscopy with polyamines: application to the analysis of yeast endogenous and artificial chromosomes”, J. Mol. Bio. 246(4):486-92, 1995), sin embargo, la secuenciacion de polinucleotidos precisa y de alto rendimiento usando estos metodos ha demostrado ser diffcil. En la Figura 58 se indican conceptualmente microscopfa electronica de transmision (TEM) y de barrido (SEM) para la deteccion de un Xpandomero. Aqrn se usa un haz de electrones enfocado para barrer un Xpandomero, que es de nuevo generalmente plano sobre una superficie. Los aspectos de la estructura del Xpandomero sirven para descodificar la informacion genetica sobre el esqueleto. Pueden usarse fijacion de espedmenes y tecnicas de recubrimiento por pulverizacion, que permiten la obtencion de imagenes de caractensticas individuales y del tamano de atomos de moleculas, para potenciar el aumento.
Tambien son de interes espectroscopfa de conductancia tunel de electrones de apertura por nanoelectrodos, en la que un haz de electrones tunel se modula entre dos puntas de nanoelectrodo por el transporte del Xpandomero entre las puntas (Lee et al., “Nanoelectrode-Gated Detection of Individual Molecules with Potential for Rapid DNA Sequencing”, Solid State Phenomena 121-123: 1379-1386, 2007). El Xpandomero perturba la corriente tunel por su efecto de barrido-conduccion, que puede amplificarse sobre ADN nativo por uso de indicadores adecuados. Esta tecnica tiene la ventaja de que se evita la fijacion de espedmenes y el requisito de vado, y en teona, pueden emplearse matrices masivamente paralelas de puertas de electrodos para leer muchos Xpandomeros en paralelo.
En la Figura 59 se ilustra conceptualmente microscopfa de fuerza atomica. En una simple realizacion, un nanotubo montado sobre un voladizo sensible se barre a traves de una superficie y las fuerzas atractivas y repulsivas entre la sonda y la superficie de la muestra se traducen en un cuadro topologico de la superficie que se barre. Esta tecnica puede lograr resolucion muy alta, pero tiene velocidades de barrido relativamente lentas (M. Miles, Science 277, 1845-1847 (1997)). La microscopfa electronica tunel de barrido (STM) es una tecnologfa relacionada para la obtencion de imagenes de superficies; la sonda, sin embargo, no toca la superficie, sino que se mide una corriente de tunel entre la superficie y la sonda. Aqrn, el Xpandomero puede depositarse plano sobre una superficie y barrerse ffsicamente con la punta de la sonda, parecido a una aguja fonografica en una grabacion.
Ensamblaje de secuencias
La secuencia de referencia del genoma humano publicada (u otra secuencia de referencia) puede usarse como herramienta de alineamiento para ayudar en el ensamblaje de cantidades masivas de datos de secuencias producidos con SBX. A pesar de la probable inclusion de pequenos huecos de secuencia, posicionalmente identificados, las capacidades de longitud de lectura largas descritas para SBX basados en Xpandomeros simplifica y mejora la fidelidad del ensamblaje de secuencias del genoma completo. Como se trata anteriormente, el proceso puede simplificarse adicionalmente dividiendo fragmentos contiguos en localizaciones dimensionalmente confinadas sobre la superficie de la reaccion de ensayo. En esta realizacion, el metodo de analisis puede reducir espectacularmente el tiempo y error de ensamblaje.
5
10
15
20
25
30
35
40
45
50
55
60
Construcciones monomericas
La Figura 9 proporciona una vision general de construcciones monomericas de la invencion. Se distinguen un total de cinco clases que incluyen cuatro clases de RT-NTP (VI, VII, VIII y IX) y una clase de XNTP (X). Cada clase se tratara individualmente a continuacion.
Las construcciones monomericas de clases VI a X se distinguen de las construcciones oligomericas de clase I a V en que usan un unico residuo de nucleobase como sustrato. En la siguiente descripcion, N, se refiere a cualquier residuo de nucleobase, pero normalmente es un nucleotido trifosfato o analogo en el presente documento. Tiene puntos de union sobre un anclaje (tambien descrito en el presente documento), por ejemplo, a los anillos heterodclicos de la base, con el grupo ribosa, o con el a-fosfato del residuo de nucleobase. Como se describe, el metodo primario de smtesis dirigida por molde usa polimerasa, pero cualquier metodo que pueda realizar la smtesis dirigida por molde es apropiado, que incluye metodos de ligacion qrnmica y enzimatica.
Para las construcciones de sustrato en las que se usan grupos conectores s y 8 para crear enlaces inter-subunidad, puede adaptarse un amplio intervalo de qrnmicas comercialmente disponibles adecuadas (Pierce, Thermo Fisher Scientific, EE.UU.) para este fin. Las qrnmicas de conectores comunes incluyen, por ejemplo, esteres de NHS con aminas, maleimidas con sulfhidrilos, imidoesteres con aminas, EDC con carboxilos para reacciones con aminas, piridildisulfuros con sulfhidrilos, y similares. Otras realizaciones implican el uso de grupos funcionales como hidrazida (HZ) y 4-formilbenzoato (4FB), que pueden entonces hacerse reaccionar adicionalmente para formar enlaces. Mas espedficamente, un amplio intervalo de reticuladores (hetero- y homo-bifuncionales) estan ampliamente disponibles (Pierce), que incluyen, pero no se limitan a, sulfo-SMCC (4-[N-maleimidometil]ciclohexano-1-carboxilato de sulfosuccinimidilo), SIA (yodoacetato de N-succinimidilo), sulfo-EMCS (ester de [N-e- maleimidocaproiloxi]sulfosuccinimida), sulfo-GMBS (ester de N-[g-maleimidobutiriloxi]sulfosuccinimida), AMAS (ester de N-(a-maleimidoacetoxi)succinimida), BMPS (N EMCA acido (N-e-maleimidocaproico)-ester de [U- maleimidopropiloxi]succinimida), EDC (clorhidrato de 1-etil-3-[3-dimetilaminopropil]carbodiimida), SANPAH (N- succinimidil-6-[4'-azido-2'-nitrofenilamino]hexanoato), SADP (N-succinimidil(4-azidofenil)-1,3'-ditiopropionato), PMPI (N-[p-Maleimidofenil]isocianato, BMPH (hidrazida del acido N-[p-maleimidopropionico], sal del acido trifluoroacetico)), EMCH (hidrazida del acido [N-e-maleimidocaproico], sal del acido trifluoroacetico), SANH (4-hidrazinonicotinato- acetonahidrazona de succinimidilo), SHTH (clorhidrato de 4-hidrazidotereftalato de succinimidilo) y C6-SFB (4- formilbenzoato de C6-succinimidilo). Por tanto, el metodo desvelado por Letsinger et al. (“Phosphorothioate oligonucleotides having modified internucleoside linkages”, la patente de EE.UU. N° 6.242.589) puede adaptarse para formar enlaces fosforotiolato.
Ademas, estan ampliamente disponibles qrnmicas de proteccion/desproteccion bien establecidas para restos de conector comunes (Benoiton, “Chemistry of Peptide Synthesis”, CRC Press, 2005). La proteccion de amino incluye, pero no se limita a, carbamato de 9-fluorenilmetilo (Fmoc-NRR'), carbamato de t-butilo (Boc-NRR'), carbamato de bencilo (Z-NRR', Cbz-NRR'), acetamida-trifluoroacetamida, ftalimida, bencilamina (Bn-NRR'), trifenilmetilamina (Tr- NRR') y bencilidenamina-p-toluenosulfonamida (Ts-NRR'). La proteccion de carboxilo incluye, pero no se limita a, ester medico, ester t-budico, ester bendlico, ester s-t-budico y 2-alquil-1,3-oxazolina. Carbonilo incluyen, pero no se limitan a, 1,3-dioxano de dimetilacetal, y N,N-dimetilhidrazona de 1,3-ditiano. Proteccion de hidroxilo incluye, pero no se limita a, eter metoximedico (MOM-OR), eter tetrahidropiramlico (THP-OR), eter t-budico, eter alflico, eter bendlico (Bn-OR), eter t-butildimetilsiKlico (TbDMS-OR), eter t-butildifenilsilflico (TBDPS-OR), ester del acido acetico, ester del acido pivalico y ester del acido benzoico.
En el presente documento, el anclaje se representa frecuentemente como una construccion de indicador con tres grupos indicadores, diversas construcciones de indicador pueden estar presentes sobre el anclaje, y pueden comprender un unico indicador para identificar el sustrato, multiples indicadores para identificar el sustrato, o el anclaje puede ser polfmero desnudo (que no tiene indicadores). Observese que pueden usarse indicadores para la sincronizacion de la deteccion, correccion de errores, redundancia, u otras funciones. En el caso del polfmero desnudo, los indicadores pueden ser el propio sustrato, o pueden estar sobre un segundo anclaje unidos al sustrato. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
Anteriormente se desvelan estrategias de codificacion de indicadores, y se tratan adicionalmente mas adelante. Por ejemplo, la codificacion binaria de dos bit de cada monomero producina cuatro secuencias de codigo unico (11,10, 01, 00), que pueden usarse para identificar cada base de secuencia (adenina “A”, citosina “C”, guanina “G”, timidina “T”), suponiendo que el acoplamiento del sustrato sea direccional. Si no tiene direccion, entonces un tercer bit proporciona codificacion inequvoca. Alternativamente, una construccion de indicador unico multiplexada de 4 estados proporciona un codigo de indicador unico para cada base de secuencia. Puede considerarse una variedad de estrategias de funcionalizacion y de marcado para construcciones de anclaje, que incluyen, por ejemplo, dendnmeros funcionalizados, polfmeros, polfmeros ramificados, nanopartmulas y nanocristales como parte de un andamiaje de indicador, ademas de qrnmicas de indicador con una caractenstica de deteccion que va a detectarse con la tecnologfa de deteccion apropiada que incluye, por ejemplo, fluorescencia, emisores o excitadores de FRET, densidad de carga, tamano o longitud. Pueden incorporarse marcas espedficas de base en el anclaje como sustratos marcados tanto antes como despues del ensamblaje del Xpandomero. Una vez el Xpandomero se ha liberado completamente y alargado, los codigos de indicador pueden detectarse y analizarse usando una variedad
5
10
15
20
25
30
35
40
45
50
55
de metodos de deteccion.
Bibliotecas de sustratos adecuados como sustratos monomericos incluyen (pero no se limitan a) ATP modificado, GTP, CTP, TTP y UTP.
Construcciones monomericas de clase VI
La Figura 60 describe construcciones de sustrato monomerico de clase VI (un tipo de RT-NTP) en mas detalle. Las Figuras 60A a 60C se leen de izquierda a derecha, mostrando primero la construccion de sustrato monomerico (precursor de Xpandomero que tiene un unico residuo de nucleobase), luego la hebra hija del duplex intermedia en el centro, y a la derecha el producto de Xpandomero preparado para la secuenciacion.
Como se muestra en la Figura 60A, las construcciones de sustrato monomerico de clase VI tienen un anclaje, T (600), unidos por un enlace (601) de un primer resto terminal a un residuo de nucleobase del sustrato, N. Un grupo conector, e, esta dispuesto en el primer resto terminal (603) del anclaje proximo a R1. En el extremo distal (604) del anclaje, un segundo resto terminal con un segundo grupo conector, 8, esta posicionado proximo a R2 El segundo resto terminal del anclaje esta asegurado al primer resto terminal en proximidad con la nucleobase por una reticulacion selectivamente escindible intra-anclaje (o por otra limitacion). La reticulacion escindible intra-anclaje (605) se indica aqrn por lmea de puntos, que puede indicar, por ejemplo, un enlace disulfuro o un conector fotoescindible. Esta limitacion previene que el anclaje se alargue o expanda y se dice que esta en su “configuracion limitada”. Bajo ensamblaje dirigido por molde, los sustratos forman un duplex con el molde diana de forma que los sustratos esten confinados. Bajo condiciones controladas, los grupos conectores colocados 8 y e de los sustratos confinados se enlazan para formar un enlace entre las construcciones de sustrato adyacentes. Los grupos conectores 8 y e de una construccion de sustrato monomerico no forman un enlace intra-sustratos debido a limitaciones del posicionamiento. Qmmicas de enlace y de proteccion/desproteccion adecuadas para 8, e, y % se detallan en la descripcion general de construcciones monomericas.
R1 y R2 son grupos terminales configurados segun convenga para el protocolo de smtesis en el que se usa la construccion de sustrato. Por ejemplo, R1 = 5'-fosfato y R2 = 3'-OH, encontranan uso en un protocolo de ligacion, y R1 = 5'-trifosfato y R2 = 3'-OH para un protocolo de polimerasa I. Opcionalmente, R2 puede configurarse con un grupo de bloqueo reversible para la adicion dclica de un unico sustrato. Alternativamente, R1 y R2 pueden configurarse con los grupos conectores terminales para el acoplamiento qmmico o con grupos no conectores para un protocolo de solo hibridacion. R1 y R2 pueden ser del tipo general XR, en la que X es un grupo de enlace y R es un grupo funcional.
Durante el ensamblaje, la construccion de sustrato monomerico se polimeriza primero sobre el extremo extensible de la hebra hija naciente por un proceso de polimerizacion dirigida por molde usando un molde monocatenario como grna. Generalmente, este proceso se inicia a partir de un cebador y avanza en la direccion de 5' a 3'. Generalmente, se usa una ADN polimerasa u otra polimerasa para formar la hebra hija, y las condiciones se seleccionan de manera que se obtenga una copia complementaria de la hebra molde. Posteriormente, el grupo conector 8, que esta ahora colocado con el grupo conector e del anclaje de subunidad adyacente, se reticula selectivamente para formar un enlace %, que es un enlace inter-anclaje inter-subunidad. Los enlaces % unen los anclajes en una cadena continua, formando un producto intermedio llamado la “hebra hija de duplex”, como se muestra en la Figura 60B. Despues de formarse el enlace %, puede romperse el enlace intra-anclaje.
La hebra hija de duplex (Figura 60B) es un hetero-copolfmero con subunidades mostradas en corchetes. El esqueleto primario (~N~)k, hebra molde (-N'-)k y anclaje (T) se muestran como una hebra hija duplexada, en la que k indica una pluralidad de subunidades de repeticion. Cada subunidad de la hebra hija es un “motivo” de repeticion y los motivos tienen variabilidad espedfica de especie, indicada aqrn por el supermdice a. La hebra hija se forma a partir de especies de la construccion de sustrato monomerico seleccionadas por un proceso dirigido por molde de una biblioteca de especies de motivos, uniendose el sustrato de monomero de cada especie de construccion de sustrato a un nucleotido complementario correspondiente sobre la hebra molde diana. De esta forma, la secuencia de residuos de nucleobase (es decir, esqueleto primario) de la hebra hija es una copia complementaria contigua de la hebra molde diana.
Cada tilde (~) indica un enlace selectivamente escindible mostrado aqrn como los enlaces inter-sustratos. Estos son selectivamente escindibles para liberar y expandir los anclajes (y el Xpandomero) sin degradar el propio Xpandomero.
La hebra hija esta compuesta por un precursor de Xpandomero llamado el “Xpandomero limitado” que esta adicionalmente compuesto de anclajes en la “configuracion limitada”. Cuando los anclajes se convierten en su “configuracion expandida”, el Xpandomero limitado se convierte en el producto de Xpandomero. Los anclajes estan limitados por los enlaces % inter-subunidad, la union de sustrato y, opcionalmente, los enlaces intra-anclaje si todavfa estan presentes. El enlace % une el primer resto terminal del anclaje de una primera subunidad con el segundo resto terminal del anclaje en el extremo confinado de una segunda subunidad y se forma enlazando los grupos conectores colocados, e de la primera subunidad y 8 de la segunda subunidad.
5
10
15
20
25
30
35
40
45
50
55
60
Puede observarse que la hebra hija tiene dos esqueletos, un “esqueleto primario” y el esqueleto del “Xpandomero limitado”. El esqueleto primario esta compuesto por los sustratos monomericos contiguamente confinados y polimerizados. El “esqueleto de Xpandomero limitado” evita el enlace selectivamente escindible entre los sustratos de monomero y se forma por restos de esqueleto enlazados con enlaces %, siendo cada resto de esqueleto un anclaje. Puede observarse que el esqueleto de Xpandomero limitado conecta mediante los enlaces selectivamente escindibles del esqueleto primario, y seguira covalentemente intacto cuando estos enlaces selectivamente escindibles se escindan y el esqueleto primario se fragmente.
El enlace % de anclaje (reticulacion de los grupos conectores 8 y e) va generalmente precedido de acoplamiento enzimatico de los sustratos de monomero para formar el esqueleto primario, con, por ejemplo, enlaces fosfodiester entre bases adyacentes. En la estructura mostrada aqrn, el esqueleto primario de la hebra hija se ha formado, y el inter-sustrato, se representan por una tilde (~) para indicar que son selectivamente escindibles. Despues de disociar o degradar la hebra molde diana, escindiendo los enlaces selectivamente escindibles (que incluyen los enlaces intra- anclaje), el Xpandomero limitado se libera y se convierte en el producto de Xpandomero. Metodos para la disociacion de la hebra molde incluyen desnaturalizacion por calor, o digestion selectiva con una nucleasa, o degradacion qmmica. Un metodo de escision de seleccion usa digestion con nucleasa en la que, por ejemplo, enlaces fosfodiester del esqueleto primario se digieren por una nucleasa y enlaces anclaje a anclaje son resistentes a nucleasa.
La Figura 60C es una representacion del producto de Xpandomero de clase VI despues de la disociacion de la hebra molde y despues de la escision de los enlaces selectivamente escindibles (incluyendo aquellos en el esqueleto primario y, si no se han escindido ya, los enlaces intra-anclaje). La hebra del producto de Xpandomero contiene una pluralidad de subunidades k, en la que k indica la subunidad kn en una cadena de m subunidades que constituyen la hebra hija, en la que k = 1,2, 3 a m, en la que m>10, generalmente m>50, y normalmente m>500 o >5.000. Cada subunidad esta formada de un anclaje en su configuracion expandida y se estira a su longitud entre los enlaces % de subunidades adyacentes. El sustrato lateral esta unido al anclaje en cada subunidad. Cada subunidad, un motivo de subunidad a, contiene informacion genetica espedfica de especie establecida por el ensamblaje dirigido por molde del producto intermedio de Xpandomero (hebra hija).
La Figura 60D muestra la construccion de sustrato de la Figura 60A como modelo molecular, en la que el miembro de sustrato de monomero, representado con un residuo de nucleobase (606), esta unido al anclaje por un enlace
(607) del primer resto terminal del anclaje. Tambien esta dispuesto sobre el primer resto terminal un grupo conector
(608) , mostrado como e en la Figura 60A. Un segundo grupo conector (609), mostrado como 8 en la Figura 60A, esta dispuesto en el segundo resto terminal en el extremo distal del anclaje. Un enlace intra-anclaje selectivamente escindible (602), representado por los triangulos contiguos, se muestra que limita el anclaje enlazando el primer y segundo resto terminal. Los grupos conectores e y 8 estan posicionados para no interaccionar y para alinearse preferentemente cerca de los lados de R1 y R2 del sustrato, respectivamente. El bucle de anclaje (600) mostrado aqrn tiene tres indicadores (590,591,592), que tambien pueden ser espedficos de especies de motivos.
La Figura 60E muestra la construccion de sustrato despues de la incorporacion en el Xpandomero producto. Las subunidades se escinden y se expanden y se enlazan por enlaces % (580,581), representados como un ovalo abierto, formados enlazando los grupos conectores 8 y e referidos en la Figura 60A. Una subunidad se indica por lmeas de puntos que agrupan verticalmente la subunidad de repeticion, como se representa por los corchetes en la Figura 60C adjunta.
En el producto de Xpandomero de la Figura 60E, el esqueleto primario se ha fragmentado y no es covalentemente contiguo debido a que cualquier enlace directo entre los sustratos de subunidades adyacentes se ha escindido. Mediante el proceso de escision, el Xpandomero limitado se libera para convertirse en el producto de Xpandomero. Los miembros de anclaje que estuvieron anteriormente en la configuracion limitada estan ahora en la configuracion expandida, sirviendo asf para estirar linealmente la informacion de secuencias de la diana molde. La expansion de los anclajes reduce la densidad lineal de la informacion de secuencias a lo largo del Xpandomero y proporciona una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion y descodificacion de la secuencia molde.
Aunque el anclaje se representa como una construccion de indicador con tres grupos indicadores, diversas construcciones de indicador pueden estar presentes sobre el anclaje, y pueden comprender indicadores individuales que identifican monomero o el anclaje puede ser un polfmero desnudo. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
Volviendo ahora a la Figura 61, se muestra un metodo de extension de una unica base (SBE) con construcciones de sustrato monomerico. Los moldes diana adaptados a los extremos (o secuencias de molde diana aleatorias, dependiendo de la naturaleza de los cebadores inmovilizados) se hibridan primero con los cebadores inmovilizados. Antes de la etapa I, los moldes inmovilizados (611) se ponen en contacto con una biblioteca de construcciones de sustrato monomericas, un miembro de la cual se muestra para ilustracion (612), y polimerasa (P). Las condiciones se ajustan para la polimerizacion dirigida por molde. En este ejemplo, los extremos 5' del primer sustrato monomerico (R2 de las Figuras 60A y 60D) se polimerizan para iniciar la hebra hija naciente. El sustrato se ha
5
10
15
20
25
30
35
40
45
50
55
sustituido en los extremos 3' (R1 de las Figuras 60A y 60D), para bloquear reversiblemente la extension adicional. Esto se muestra en mas detalle en la Figura 61a aumentada (lmeas de puntos), en la que el sustrato monomerico se muestra confinando el cebador. Este sustrato es un 5'-trifosfato, y se forma un enlace fosfodiester con el cebador por accion de la polimerasa. Debe observarse que el grupo funcional reactivo (8 de la Figura 60A) mostrado en la Figura 61c normalmente esta desactivado (mediante reaccion u otros medios) en el primer sustrato anadido (como se muestra en la Figura 61a por el rectangulo).
En la etapa I de la Figura 61, el grupo de bloqueo se elimina (sin rectangulo) para permitir la adicion de otro monomero (extension). Los metodos para bloquear reversiblemente el extremo 3' incluyen el uso de Pd para catalizar la eliminacion de un grupo alilo para regenerar un extremo 3'-hidroxilo viable, o el uso de nucleotidos terminados con 3'-O-(2-nitrobencilo), en los que los hidroxilos activos pueden regenerarse por exposicion a una fuente de UV para fotoescindir el resto terminal como se describe por Ju et al. (“Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators”, PNAS 26;103(52): 19635-19640, 2006, y “Four-color DNA sequencing by synthesis on a chip using photocleavable fluorescent nucleotides”, PNAS 26;102(17):5926-31, 2005). El 3'-OH regenerado se muestra en mas detalle en la Figura 61 b en vista aumentada. En esta vista, los extremos confinados de la construccion de sustrato adyacente y cebador se polimerizan y el extremo 3'OH de la hebra hija naciente se activa eliminando el grupo de bloqueo. En la etapa II, el molde se pone en contacto con una biblioteca de construcciones de sustrato monomerico, en la que los grupos funcionales 8 son reactivos bajo condiciones controladas, y un sustrato de monomero se polimeriza con la hebra hija naciente. Esta polimerizacion coloca los grupos e (608) y 8 (609) de las construcciones de sustrato confinadas como se muestra en la Figura 61 c. En la etapa III, bajo condiciones controladas, estos grupos reaccionan para formar un enlace % (580), como se muestra en mas detalle en la Figura 61 d.
Como se indica, el ciclado a traves de las etapas II, III y IV extiende la hija naciente cada vez por sustrato adicional (construccion). Normalmente, puede usarse una etapa de lavado para eliminar reactivos sin reaccionar entre etapas. El proceso es asf analogo a lo que se llama en la bibliograffa, “extension de una unica base” cfclica. El proceso se muestra con polimerasa, P, pero puede adaptarse para una ligasa o un protocolo qrnmico de ligacion adecuado para unir construcciones de sustrato en una smtesis dirigida por molde. La etapa V muestra el producto intermedio de la hebra hija para el Xpandomero (605). Este producto intermedio puede disociarse del molde y el cebador, por ejemplo, con una nucleasa que ataca el esqueleto primario de la hebra hija, aliviando asf los anclajes limitados y liberando el producto de Xpandomero.
Al igual que con todos los metodos de SBE, el eficaz lavado entre ciclos es util para reducir reacciones secundarias no deseables. Para facilitar adicionalmente la incorporacion de bases individuales mediante regiones de molde con alta estructura secundaria, la temperatura de extension puede variarse a traves de cada ciclo de extension y/o aditivos o adyuvantes, tales como betama, TMACL, o PEG, tambien pueden anadirse para neutralizar los efectos de la estructura secundaria (como se hace en protocolos convencionales de extension de polimerasa). Y, si fuera necesario, la estequiometna de las especies de construccion de sustrato puede variarse para compensar el sesgo de la reaccion que favorece ciertas bases, tales como C o G.
Un metodo alternativo para producir Xpandomeros de clase VI es hacer la polimerizacion procesiva basada en polimerasa. ADN y ARN polimerasas, ademas de cualquier enzima que funcione similarmente, demostraron catalizar la polimerizacion precisa de RT-NTP, grupos R de bloqueo reversiblemente terminales ausentes, pueden considerarse para este enfoque.
Se conoce un amplio intervalo de qrnmicas de reticulacion en este campo, y son utiles para la formacion de enlaces %. Estos incluyen el uso de esteres de NHS con aminas, maleimidas con sulfhidrilos, imidoesteres con aminas, EDC con sulfhidrilos y carboxilos para reacciones con aminas, piridildisulfuros con sulfhidrilos, etc. Otras realizaciones implican el uso de grupos funcionales como hidrazida (HZ) y 4-formilbenzoato (4FB), que pueden entonces hacerse reaccionar adicionalmente para enlazar subunidades. En una opcion, dos qrnmicas de enlace diferentes, e1/81 y e2/82 (tambien denominadas L1/L1' y L2/L2' en otras partes de este documento) que reaccionan para formar enlaces %1 y %2, respectivamente, y pueden usarse para funcionalizar diferencialmente dos conjuntos de construcciones de sustrato de RT-NTP. Por ejemplo, si se realiza un ciclo de SBE con un conjunto de RT-NTP funcionalizado con e1/82, el siguiente ciclo de SBE usana el conjunto de e2/81, haciendo que una reaccion de 82/e2 colocados formara %1. La activacion ordenada de los pares de reticulacion es util para minimizar los errores de reticulacion y reacciones secundarias no deseadas.
Construcciones monomericas de clase VII
Las moleculas de clase VII son analogos de las de clase VI descritas previamente. La diferencia primaria es que el enlace escindible es entre el anclaje y el sustrato en lugar de entre los sustratos. En la Figura 62, las construcciones de sustrato monomerico de clase VII (un tipo de RT-NTP) se desvelan en mas detalle. Las Figuras 62A a 62C se leen de izquierda a derecha, mostrando primero la construccion de sustrato monomerico (precursor de Xpandomero que tiene un unico residuo de nucleobase), luego la hebra hija del duplex intermedia en el centro, y a la derecha el producto de Xpandomero preparado para la secuenciacion.
5
10
15
20
25
30
35
40
45
50
55
Como se muestra en la Figura 62A, las construcciones de sustrato monomerico de clase VII tienen un anclaje, T (620), unido por un conector selectivamente escindible (621) a un primer resto terminal a un residuo de nucleobase del sustrato, N. Otro grupo conector, e (622), esta dispuesto en el primer resto terminal del anclaje proximo a R1. En el extremo distal del anclaje T un segundo resto terminal con un segundo grupo conector, 8 (623), esta posicionado proximo a R2. El segundo resto terminal del anclaje esta asegurado al primer resto terminal en proximidad con la nucleobase por una reticulacion selectivamente escindible intra-anclaje (624) (o por otra limitacion). La reticulacion escindible intra-anclaje se indica aqrn por lmea de puntos, que puede indicar, por ejemplo, un enlace disulfuro o un conector fotoescindible. Esta limitacion previene que el anclaje se alargue o expanda y esta en una “configuracion limitada”. Bajo ensamblaje dirigido por molde, los sustratos forman un duplex con el molde diana de forma que los sustratos esten confinados. Bajo condiciones controladas, los grupos conectores colocados 8 y e de los sustratos confinados se enlazan para formar un enlace entre las construcciones de sustrato adyacentes. Los grupos conectores 8 y e de una construccion de sustrato monomerico no forman un enlace intra-sustratos debido a limitaciones del posicionamiento. Qmmicas de enlace y de proteccion/desproteccion adecuadas para 8, e y % se detallan en la descripcion general de construcciones monomericas.
R1 y R2 son grupos terminales configurados segun convenga para el protocolo de smtesis en el que se usa la construccion de sustrato. Por ejemplo, R1 = 5'-fosfato y R2 = 3'-Oh, encontranan uso en un protocolo de ligacion, y R1 = 5'-trifosfato y R2 = 3'-OH para un protocolo de polimerasa I. Opcionalmente, R2 puede configurarse con un grupo de bloqueo reversible para la adicion dclica de un unico sustrato. Alternativamente, R1 y R2 pueden configurarse con los grupos conectores terminales para el acoplamiento qmmico o con grupos no conectores para un protocolo de solo hibridacion. R1 y R2 pueden ser del tipo general XR, en la que X es un grupo de enlace y R es un grupo funcional.
Durante el ensamblaje, la construccion de sustrato monomerico se polimeriza primero sobre el extremo extensible de la hebra hija naciente por un proceso de polimerizacion dirigida por molde usando un molde monocatenario como grna. Generalmente, este proceso se inicia a partir de un cebador y avanza en la direccion de 5' a 3'. Generalmente, se usa una ADN polimerasa u otra polimerasa para formar la hebra hija, y las condiciones se seleccionan de manera que se obtenga una copia complementaria de la hebra molde. Posteriormente, se provoca que el grupo conector 8, que esta ahora colocado con el grupo conector e del anclaje de subunidad adyacente, se reticule y forme un enlace %, que es un enlace inter-anclaje inter-subunidad. Los enlaces % unen los anclajes en una cadena continua, formando un producto intermedio llamado la “hebra hija de duplex”, como se muestra en la Figura 62B. Despues de formarse el enlace %, puede romperse el enlace intra-anclaje.
La hebra hija de duplex (Figura 62B) es un hetero-copolfmero con subunidades mostradas en corchetes. El esqueleto primario (-N-)k, hebra molde (-N'-)k y anclaje (T) se muestran como una hebra hija duplexada, en la que k indica una pluralidad de subunidades de repeticion. Cada subunidad de la hebra hija es un “motivo” de repeticion y los motivos tienen variabilidad espedfica de especie, indicada aqrn por el supermdice a. La hebra hija se forma a partir de especies de la construccion de sustrato monomerico seleccionadas por un proceso dirigido por molde de una biblioteca de especies de motivos, uniendose el sustrato de monomero de cada especie de construccion de sustrato a un nucleotido complementario correspondiente sobre la hebra molde diana. De esta forma, la secuencia de residuos de nucleobase (es decir, esqueleto primario) de la hebra hija es una copia complementaria contigua de la hebra molde diana.
La tilde (~) indica un enlace selectivamente escindible mostrado aqrn como el anclaje al conector de sustrato. Estos son selectivamente escindibles para liberar y expandir los anclajes (y el Xpandomero) sin degradar el propio Xpandomero.
La hebra hija esta compuesta por un precursor de Xpandomero llamado el “Xpandomero limitado” que esta adicionalmente compuesto de anclajes en la “configuracion limitada”. Cuando los anclajes se convierten en su “configuracion expandida”, el Xpandomero limitado se convierte en el producto de Xpandomero. Los anclajes estan limitados por los enlaces % inter-subunidad, el enlace escindible al sustrato y, opcionalmente, los enlaces intra- anclaje si todavfa estan presentes. El enlace % une el primer resto terminal del anclaje de una primera subunidad con el segundo resto terminal del anclaje en el extremo confinado de una segunda subunidad y se forma enlazando los grupos conectores colocados, e de la primera subunidad y 8 de la segunda subunidad.
Puede observarse que la hebra hija tiene dos esqueletos, un “esqueleto primario” y un “esqueleto de Xpandomero limitado”. El esqueleto primario esta compuesto por los sustratos monomericos contiguamente confinados y polimerizados. El esqueleto de Xpandomero limitado evita el enlace selectivamente escindible que conecta con el sustrato y se forma por restos de esqueleto enlazados por enlace %, siendo cada resto de esqueleto un anclaje. Puede observarse que el esqueleto de Xpandomero limitado conecta mediante los enlaces selectivamente escindibles conectados al esqueleto primario, y seguira covalentemente intacto cuando estos enlaces selectivamente escindibles se escindan y el esqueleto primario se disocie o fragmente.
El enlace % de anclaje (reticulacion de los grupos conectores 8 y e) va generalmente precedido de acoplamiento enzimatico de los sustratos de monomero para formar el esqueleto primario con, por ejemplo, enlaces fosfodiester entre bases adyacentes. En la estructura mostrada aqrn, el esqueleto primario de la hebra hija se ha formado, y el
5
10
15
20
25
30
35
40
45
50
55
inter-sustrato, se representan por una tilde (~) para indicar que son selectivamente escindibles. Despues de disociar o degradar la hebra molde diana, escindiendo los enlaces selectivamente escindibles (que incluyen los enlaces intra- anclaje), el Xpandomero limitado se libera y se convierte en el producto de Xpandomero. Metodos para la disociacion de la hebra molde incluyen desnaturalizacion por calor, o digestion selectiva con una nucleasa, o degradacion qmmica. Un metodo de escision de seleccion usa digestion con nucleasa en la que, por ejemplo, enlaces fosfodiester del esqueleto primario se digieren por una nucleasa y enlaces anclaje a anclaje son resistentes a nucleasa.
La Figura 62C es una representacion del producto de Xpandomero de clase VII despues de la disociacion de la hebra molde y despues de la escision de los enlaces selectivamente escindibles (incluyendo aquellos unidos al esqueleto primario y, si no se han escindido ya, los enlaces intra-anclaje). La hebra del producto de Xpandomero contiene una pluralidad de subunidades k, en la que indica la subunidad kn en una cadena de m subunidades que constituyen la hebra hija, en la que k = 1, 2, 3 a m, en la que m>10, generalmente m>50, y normalmente m>500 o >5.000. Cada subunidad esta formada de un anclaje (620) en su configuracion expandida y se estira a su longitud entre los enlaces % de subunidades adyacentes. El esqueleto primario se ha eliminado completamente. Cada subunidad, un motivo de subunidad a, contiene informacion genetica espedfica de especie establecida por el ensamblaje dirigido por molde del producto intermedio de Xpandomero (hebra hija).
La Figura 62D muestra la construccion de sustrato de la Figura 62A como modelo molecular, en la que el miembro de sustrato de monomero, representado con un residuo de nucleobase (626), enlazado por un enlace selectivamente escindible (625) al primer resto terminal del anclaje. Tambien esta dispuesto sobre el primer resto terminal un grupo conector (629), mostrado como e en la Figura 62A. Un segundo grupo conector (628), mostrado como 8 en la Figura 62A, esta dispuesto en el segundo resto terminal en el extremo distal del anclaje. Se muestra un enlace intra-anclaje selectivamente escindible (627), representado por los triangulos contiguos, que limita el anclaje enlazando el primer y segundo resto terminal. Los grupos conectores e (629) y 8 (628) estan posicionados para no interaccionar y para alinearse preferentemente cerca de los lados de R1 y R2 del sustrato, respectivamente. El bucle de anclaje mostrado aqrn tiene tres indicadores (900,901,902), que tambien pueden ser espedficos de especies de motivos.
La Figura 62E muestra la construccion de sustrato despues de la incorporacion en el Xpandomero producto. Las subunidades se escinden y se expanden y se enlazan por enlaces % (910), representados como un ovalo abierto, formados enlazando los grupos conectores 8 y e referidos en la Figura 62A. Una subunidad se indica por lmeas de puntos que agrupan verticalmente la subunidad de repeticion, como se representa por los corchetes en la Figura 62C adjunta.
En el producto de Xpandomero de la Figura 62E, el esqueleto primario se ha disociado o fragmentado y esta separado del Xpandomero. Mediante el proceso de escision, el Xpandomero limitado se libera para convertirse en el producto de Xpandomero. Los miembros de anclaje que estuvieron anteriormente en la configuracion limitada estan ahora en la configuracion expandida, sirviendo asf para estirar linealmente la informacion de secuencias de la diana molde. La expansion de los anclajes reduce la densidad lineal de la informacion de secuencias a lo largo del Xpandomero y proporciona una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion y descodificacion de la secuencia molde.
Aunque el anclaje se representa como una construccion de indicador con tres grupos indicadores, diversas construcciones de indicador pueden estar presentes sobre el anclaje, y pueden comprender indicadores individuales que identifican monomero o el anclaje puede ser un polfmero desnudo. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
Construcciones monomericas de clase VIII
Las moleculas de clase VIII son analogos de la clase VI descrita previamente. La diferencia primaria es que el grupo conector, e, esta conectado directamente al sustrato en lugar de al anclaje. En la Figura 63, los presentes inventores describen construcciones de sustrato monomerico de clase VIII (un tipo de RT-NTP) en mas detalle. Las Figuras 63A a 63C se leen de izquierda a derecha, mostrando primero la construccion de sustrato monomerico (precursor de Xpandomero que tiene un unico residuo de nucleobase), luego la hebra hija del duplex intermedia en el centro, y a la derecha el producto de Xpandomero preparado para la secuenciacion.
Como se muestra en la Figura 63A, las construcciones de sustrato monomerico de clase VII tienen un anclaje, T (630), unido por un enlace (631) de un primer resto terminal a un residuo de nucleobase del sustrato, N. En el extremo distal del anclaje (632), un segundo resto terminal con un segundo grupo conector, 8, esta posicionado preferencialmente proximo a R2. El segundo resto terminal del anclaje esta asegurado al primer resto terminal en proximidad con la nucleobase por una reticulacion selectivamente escindible intra-anclaje (o por otra limitacion). La reticulacion escindible intra-anclaje (633) se indica aqrn por lmea de puntos, que puede indicar, por ejemplo, un enlace disulfuro o un conector fotoescindible. Esta limitacion previene que el anclaje se alargue o expanda y se dice que esta en su “configuracion limitada”. Un grupo conector, e (635), esta unido al sustrato de monomero preferencialmente proximo a R1. Bajo ensamblaje dirigido por molde, los sustratos forman un duplex con el molde
5
10
15
20
25
30
35
40
45
50
55
diana de forma que los sustratos esten confinados. Bajo condiciones controladas, los grupos conectores 8 y e de los sustratos confinados esta colocados y se enlazan para formar un enlace entre las construcciones de sustrato adyacentes. Los grupos conectores 8 y e de una construccion de sustrato monomerico no forman un enlace intra- sustratos debido a limitaciones del posicionamiento. Qmmicas de enlace y de proteccion/desproteccion adecuadas para 8, e y % se detallan en la descripcion general de construcciones monomericas.
R1 y R2 son grupos terminales configurados segun convenga para el protocolo de smtesis en el que se usa la construccion de sustrato. Por ejemplo, R1 = 5'-fosfato y R2 = 3'-Oh, encontranan uso en un protocolo de ligacion, y R1 = 5'-trifosfato y R2 = 3'-OH para un protocolo de polimerasa I. Opcionalmente, R2 puede configurarse con un grupo de bloqueo reversible para la adicion dclica de un unico sustrato. Alternativamente, R1 y R2 pueden configurarse con los grupos conectores terminales para el acoplamiento qmmico o con grupos no conectores para un protocolo de solo hibridacion. R1 y R2 pueden ser del tipo general XR, en la que X es un grupo de enlace y R es un grupo funcional.
Durante el ensamblaje, la construccion de sustrato monomerico se polimeriza primero sobre el extremo extensible de la hebra hija naciente por un proceso de polimerizacion dirigida por molde usando un molde monocatenario como grna. Generalmente, este proceso se inicia a partir de un cebador y avanza en la direccion de 5' a 3'. Generalmente, se usa una ADN polimerasa u otra polimerasa para formar la hebra hija, y las condiciones se seleccionan de manera que se obtenga una copia complementaria de la hebra molde. Posteriormente, se provoca que el grupo conector 8, que esta ahora colocado con el grupo conector e del anclaje de subunidad adyacente, se reticule y forme un enlace %, que es u enlace inter-subunidad. Los enlaces % proporcionan u segundo enlace entre subunidades (los enlaces inter-sustratos polimerizados so los primeros) y forman un producto intermedio llamado la “hebra hija de duplex”, como se muestra en la Figura 63B.
La hebra hija de duplex (Figura 63B) es un hetero-copolfmero con subunidades mostradas en corchetes. El esqueleto primario (~N~)k, hebra molde (-N'-)k y anclaje (T) se muestran como una hebra hija duplexada, en la que k indica una pluralidad de subunidades de repeticion. Cada subunidad de la hebra hija es un “motivo” de repeticion y los motivos tienen variabilidad espedfica de especie, indicada aqrn por el supermdice a. La hebra hija se forma a partir de especies de la construccion de sustrato monomerico seleccionadas por un proceso dirigido por molde de una biblioteca de especies de motivos, uniendose el sustrato de monomero de cada especie de construccion de sustrato a un nucleotido complementario correspondiente sobre la hebra molde diana. De esta forma, la secuencia de residuos de nucleobase (es decir, esqueleto primario) de la hebra hija es una copia complementaria contigua de la hebra molde diana.
Cada tilde (~) indica un enlace selectivamente escindible mostrado aqrn como los enlaces inter-sustratos. Estos son necesariamente selectivamente escindibles para liberar y expandir los anclajes (y el Xpandomero) sin degradar el propio Xpandomero.
La hebra hija esta compuesta por un precursor de Xpandomero llamado el “Xpandomero limitado” que esta adicionalmente compuesto de anclajes en la “configuracion limitada”. Cuando los anclajes se convierten en su “configuracion expandida”, el Xpandomero limitado se convierte en el producto de Xpandomero. Los anclajes estan limitados por los enlaces % inter-subunidad, la union de sustratos y, opcionalmente, los enlaces intra-anclaje si todavfa estan presentes. El enlace % une el sustrato de una primera subunidad con el anclaje del segundo resto terminal en el extremo confinado de una segunda subunidad y se forma enlazando los grupos conectores colocados, e de la primera subunidad y 8 de la segunda subunidad.
Puede observarse que la hebra hija tiene dos esqueletos, un “esqueleto primario” y el esqueleto del “Xpandomero limitado”. El esqueleto primario esta compuesto por los sustratos monomericos contiguamente confinados y polimerizados. El “esqueleto de Xpandomero limitado” evita el enlace selectivamente escindible entre los sustratos de monomero y se forma por restos de esqueleto enlazados por enlace %, siendo cada resto de esqueleto un anclaje enlazado a un sustrato que entonces se enlaza con el siguiente anclaje de resto de esqueleto con un enlace %. Puede observarse que el esqueleto de Xpandomero limitado conecta mediante los enlaces selectivamente escindibles del esqueleto primario, y seguira covalentemente intacto cuando estos enlaces selectivamente escindibles se escindan y el esqueleto primario se fragmente.
El enlace % de anclaje (reticulacion de los grupos conectores 8 y e) va generalmente precedido de acoplamiento enzimatico de los sustratos de monomero para formar el esqueleto primario, con, por ejemplo, enlaces fosfodiester entre bases adyacentes. En la estructura mostrada aqrn, el esqueleto primario de la hebra hija se ha formado, y los enlaces inter-sustratos se representan por una tilde (~) para indicar que son selectivamente escindibles. Despues de disociar o degradar la hebra molde diana, escindiendo los enlaces selectivamente escindibles (que incluyen los enlaces intra-anclaje), el Xpandomero limitado se libera y se convierte en el producto de Xpandomero. Metodos para la disociacion de la hebra molde incluyen desnaturalizacion por calor, o digestion selectiva con una nucleasa, o degradacion qmmica. Un metodo de escision de seleccion usa digestion con nucleasa en la que, por ejemplo, enlaces fosfodiester del esqueleto primario se digieren por una nucleasa y enlaces anclaje a anclaje son resistentes a nucleasa.
5
10
15
20
25
30
35
40
45
50
55
La Figura 63C es una representacion del producto de Xpandomero de clase VIII despues de la disociacion de la hebra molde y despues de la escision de los enlaces selectivamente escindibles (incluyendo aquellos en el esqueleto primario y, si no se han escindido ya, los enlaces intra-anclaje). La hebra del producto de Xpandomero contiene una pluralidad de subunidades k, en la que indica la subunidad Kn en una cadena de m subunidades que constituyen la hebra hija, en la que k = 1, 2, 3 a m, en la que m>10, generalmente m>50, y normalmente m>500 o >5.000. Cada subunidad esta formada de un anclaje en su configuracion expandida y se estira a su longitud entre los enlaces % de subunidades adyacentes. El sustrato lateral esta unido al anclaje en cada subunidad. Cada subunidad, un motivo de subunidad a, contiene informacion genetica espedfica de especie establecida por el ensamblaje dirigido por molde del producto intermedio de Xpandomero (hebra hija).
La Figura 63D muestra la construccion de sustrato de la Figura 63A como modelo molecular, en la que el miembro de sustrato de monomero, representado con un residuo de nucleobase (634), esta unido al anclaje por un enlace (631) del primer resto terminal del anclaje. Un segundo grupo conector (639), mostrado como 8 en la Figura 63A, esta dispuesto en el segundo resto terminal en el extremo distal del anclaje. Se muestra un enlace intra-anclaje selectivamente escindible (633), representado por los triangulos contiguos, que limita el anclaje enlazando el primer y segundo resto terminal. Tambien unidos al sustrato esta un grupo conector (638), mostrado como e en la Figura 63A. Los grupos conectores e (638) y 8 (639) estan posicionados para no interaccionar y para alinearse preferentemente cerca de los lados de R1 y R2del sustrato, respectivamente. El bucle de anclaje mostrado aqrn tiene tres indicadores (900,901,902), que tambien pueden ser espedficos de especies de motivos. La reticulacion intra- anclaje escindible (633) se muestra en la Figura 63D y la Figura 63E que esta posicionada mas proxima al sustrato que 8 (639). En las Figuras 60D y Figura 60E, las posiciones estan cambiadas. Este posicionamiento puede estar en cualquier sitio y en una realizacion ambas funciones de conector pueden estar sobre un unico grupo multifuncional.
La Figura 63E muestra la construccion de sustrato despues de la incorporacion en el Xpandomero producto. Las subunidades se escinden y se expanden y se enlazan por enlaces % (970,971), representados como un ovalo abierto, formados enlazando los grupos conectores 8 y e referidos en la Figura 63A. Una subunidad se indica por lmeas de puntos que agrupan verticalmente la subunidad de repeticion, como se representa por los corchetes en la Figura 63C adjunta.
En el producto de Xpandomero de la Figura 63E, el esqueleto primario se ha fragmentado y no es covalentemente contiguo debido a que cualquier enlace directo entre los sustratos de subunidades adyacentes se ha escindido. Mediante el proceso de escision, el Xpandomero limitado se libera para convertirse en el producto de Xpandomero. Los miembros de anclaje que estuvieron anteriormente en la configuracion limitada estan ahora en la configuracion expandida, sirviendo asf para estirar linealmente la informacion de secuencias de la diana molde. La expansion de los anclajes reduce la densidad lineal de la informacion de secuencias a lo largo del Xpandomero y proporciona una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion y descodificacion de la secuencia molde.
Aunque el anclaje (630) se representa como una construccion de indicador con tres grupos indicadores, diversas construcciones de indicador pueden estar presentes sobre el anclaje, y pueden comprender indicadores individuales que identifican monomero o el anclaje puede ser un polfmero desnudo. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
Construcciones monomericas de clase IX
Una construccion de sustrato de clase IX se distingue de la otra RT-NTP debido a que tiene dos puntos de union de anclaje a los que un anclaje libre esta unido despues de ensamblarse el esqueleto primario. La Figura 64 describe construcciones de sustrato monomerico de clase IX (a tipo de RT-NTP) en mas detalle. Las Figuras 64A a 64C se leen de izquierda a derecha, mostrando primero la construccion de sustrato monomerico (precursor de Xpandomero que tiene un unico residuo de nucleobase), luego la hebra hija del duplex intermedia en el centro, y a la derecha el producto de Xpandomero preparado para la secuenciacion.
Como se muestra en la Figura 64A, la construccion de sustrato monomerico de clase IX tiene un residuo de nucleobase del sustrato, N, con dos sitios de union de anclaje, los grupos conectores 81 y 82. Tambien se muestra un anclaje libre, T (640), con los grupos conectores e1 y e2 de un primer y segundo resto terminal del anclaje. El primer y segundo restos terminales del anclaje limitan el libre anclaje por una reticulacion selectivamente escindible intra- anclaje (647) y sirve para colocar los grupos conectores e1 y e2. La reticulacion escindible se indica aqrn por lmea de puntos, puede indicar, por ejemplo, un enlace disulfuro o un conector fotoescindible. Esta limitacion previene que el anclaje se alargue o expanda y se dice que esta en su “configuracion limitada”. Los grupos conectores, 8 y 82, estan unidos al sustrato de monomero orientado proximo a R1 y R2, respectivamente. Bajo srntesis dirigida por molde, los sustratos forman un duplex con el molde diana y el grupo conector de una construccion de sustrato, por ejemplo 81 y el grupo conector de la construccion de sustrato confinada, por ejemplo 82, estan colocados. Bajo condiciones controladas, estos conectores colocados se ponen en contacto con los conectores e colocados en el extremo del anclaje libre. Se producen dos reacciones de enlaces selectivos, e1 y 81 para formar x1 y e2 y 82 para formar %2; los sustratos adyacentes estan ahora conectados por el anclaje limitado. Qrnmicas de enlace y de
5
10
15
20
25
30
35
40
45
50
55
proteccion/desproteccion adecuadas para 8, g y x se detallan en la descripcion general de construcciones monomericas.
R1 y R2 son grupos terminales configurados segun convenga para el protocolo de smtesis en el que se usa la construccion de sustrato. Por ejemplo, R1 = 5'-fosfato y R2 = 3'-OH, encontranan uso en un protocolo de ligacion, y R1 = 5'-trifosfato y R2 = 3'-OH para un protocolo de polimerasa I. Opcionalmente, R2 puede configurarse con un grupo de bloqueo reversible para la adicion dclica de un unico sustrato. Alternativamente, R1 y R2 pueden configurarse con los grupos conectores terminales para el acoplamiento qmmico o con grupos no conectores para un protocolo de solo hibridacion. R1 y R2 pueden ser del tipo general XR, en la que X es un grupo de enlace y R es un grupo funcional.
Durante el ensamblaje, la construccion de sustrato monomerico (sin anclaje) se polimeriza sobre el extremo extensible de la hebra hija naciente por un proceso de polimerizacion dirigida por molde usando un molde monocatenario como grna. Generalmente, este proceso se inicia a partir de un cebador y avanza en la direccion de 5' a 3'. Generalmente, se usa una ADN polimerasa u otra polimerasa para formar la hebra hija, y las condiciones se seleccionan de manera que se obtenga una copia complementaria de la hebra molde. El grupo conector 81 esta ahora colocado con el grupo conector 82 del sustrato de monomero adyacente. Despues de la polimerizacion del esqueleto primario, los anclajes libres se reticulan para formar enlaces x1 y enlaces %2 entre los dos extremos de anclaje y dos de los sustratos adyacentes.
En una realizacion, los anclajes libres no tienen informacion de secuencias y se llaman “desnudos”. En este caso, puede usarse qrnmica de un unico conector de manera que los grupos conectores 81 y 82 sean los mismos y los grupos conectores g1 y g2 sean los mismos con un tipo de enlace %.
En la realizacion en la que el anclaje libre comprende informacion de tipo base (como en los indicadores), hay anclajes libres espedficos de especie. Generalmente, hay cuatro tipos de base que requerinan cuatro tipos de anclaje libre con la informacion de bases correspondiente. Pueden usarse varios metodos para enlazar las especies de anclaje libre a su base correcta. En un metodo, se usan cuatro qrnmicas de enlace heteroespedfico para diferenciar adicionalmente el par de conectores 81 y g1, ahora se expresan como 81 a y g1a en la que a es uno de cuatro tipos y forman tipos de enlace %1a. 81a y 81 a de un tipo a se enlazaran solo entre sf. En este metodo, se provoca que el par de conectores 82 y g2 se enlacen solo despues de formarse 81 a y g1a. En un segundo metodo, se usan diferentes grupos de proteccion selectivamente desprotegibles, en los que cada grupo de proteccion esta asociado a un tipo de conector, para bloquear selectivamente los grupos conectores. En un primer ciclo, no hay proteccion en un tipo de base y su tipo de anclaje libre asociado es g1 unido a 81 para formar un enlace x1. En un segundo ciclo, un tipo de grupo de proteccion se elimina de un tipo de base y su tipo de anclaje libre asociado es g1 unido a 81 para formar un enlace x1. Este ultimo ciclo se repite para los dos siguientes tipos de base y despues de completarse, se provoca que el par de conector 82 y g2 se enlacen. Entre cada etapa se incluyen etapas de lavado para reducir los errores de union. Sin perdida de generalidad, la restante descripcion sera en terminos de enlaces x1 y enlaces %2 Observese que despues de unirse el anclaje y formarse los enlaces %, puede romperse el enlace intra- anclaje.
Como se muestra en la Figura 64B, los enlaces x1 proporcionan un enlace entre subunidades (ademas de los enlaces inter-sustratos polimerizados) y forman un producto intermedio llamado la “hebra hija de duplex”. El esqueleto primario (~N~)k, hebra molde (-N'-)k y anclaje (T) se muestran como una hebra hija duplexada, en la que k indica una pluralidad de subunidades de repeticion. Cada subunidad de la hebra hija es un “motivo” de repeticion y los motivos tienen variabilidad espedfica de especie, indicada aqrn por el supermdice a. La hebra hija se forma a partir de especies de la construccion de sustrato monomerico seleccionadas por un proceso dirigido por molde de una biblioteca de especies de motivos, uniendose el sustrato de monomero de cada especie de construccion de sustrato a un nucleotido complementario correspondiente sobre la hebra molde diana. De esta forma, la secuencia de residuos de nucleobase (es decir, esqueleto primario) de la hebra hija es una copia complementaria contigua de la hebra molde diana.
Cada tilde (~) indica un enlace selectivamente escindible mostrado aqrn como los enlaces inter-sustratos. Estos son necesariamente selectivamente escindibles para liberar y expandir los anclajes (y el Xpandomero) sin degradar el propio Xpandomero.
La hebra hija esta compuesta por un precursor de Xpandomero llamado el “Xpandomero limitado” que esta adicionalmente compuesto de anclajes en la “configuracion limitada”. Cuando los anclajes se convierten en su “configuracion expandida”, el Xpandomero limitado se convierte en el producto de Xpandomero. Los anclajes estan limitados por los enlaces x a sustratos adyacentes y, opcionalmente, los enlaces intra-anclaje (si todavfa estan presentes).
Puede observarse que la hebra hija tiene dos esqueletos, un “esqueleto primario” y el esqueleto del “Xpandomero limitado”. El esqueleto primario esta compuesto por los sustratos monomericos contiguamente confinados y polimerizados. El “esqueleto de Xpandomero limitado” evita el enlace selectivamente escindible entre sustratos de monomero y se forma por restos de restos de esqueleto enlazados con enlace x1, siendo cada resto de esqueleto un
5
10
15
20
25
30
35
40
45
50
55
anclaje enlazado a un sustrato (por un enlace %2) que entonces se enlaza con el siguiente anclaje de resto de esqueleto con un enlace x1. Puede observarse que el esqueleto de Xpandomero limitado conecta mediante los enlaces selectivamente escindibles del esqueleto primario, y seguira covalentemente intacto cuando estos enlaces selectivamente escindibles se escindan y el esqueleto primario se fragmente.
El enlace % de anclaje (reticulacion de los grupos conectores 8 y e) va generalmente precedido de acoplamiento enzimatico de los sustratos de monomero para formar el esqueleto primario, con, por ejemplo, enlaces fosfodiester entre bases adyacentes. En la estructura mostrada aqrn, el esqueleto primario de la hebra hija se ha formado, y los enlaces inter-sustratos se representan por una tilde (~) para indicar que son selectivamente escindibles. Despues de disociar o degradar la hebra molde diana, escindiendo los enlaces selectivamente escindibles (que incluyen los enlaces intra-anclaje), el Xpandomero limitado se libera y se convierte en el producto de Xpandomero. Metodos para la disociacion de la hebra molde incluyen desnaturalizacion por calor, o digestion selectiva con una nucleasa, o degradacion qmmica. Un metodo de escision de seleccion usa digestion con nucleasa en la que, por ejemplo, enlaces fosfodiester del esqueleto primario se digieren por una nucleasa y enlaces anclaje a anclaje son resistentes a nucleasa.
La Figura 64C es una representacion del producto de Xpandomero de clase IX despues de la disociacion de la hebra molde y despues de la escision de los enlaces selectivamente escindibles (incluyendo aquellos en el esqueleto primario y, si no se han escindido ya, los enlaces intra-anclaje). La hebra del producto de Xpandomero contiene una pluralidad de subunidades k, en la que indica la subunidad Kn en una cadena de m subunidades que constituyen la hebra hija, en la que k = 1,2, 3 a m, en la que m>10, generalmente m>50, y normalmente m>500 o >5.000. Cada subunidad esta formada de un anclaje (640) en su configuracion expandida enlazada a un sustrato de monomero y con el enlace %1 con la siguiente subunidad adyacente. Cada subunidad, un motivo de subunidad a, contiene informacion genetica espedfica de especie establecida por el ensamblaje dirigido por molde del producto intermedio de Xpandomero (hebra hija).
La Figura 64D muestra la construccion de sustrato de la Figura 64A como modelo molecular, en la que el miembro de sustrato de monomero, representado con un residuo de nucleobase (641), tiene dos enlaces (642,643), mostrados en la Figura 64a como 81 y 82, que seran puntos de union para el anclaje libre. El anclaje libre se muestra con dos grupos conectores (644,645), mostrados como 81 y 82 en la Figura 64A, sobre el primer y segundo restos terminales del anclaje. Se muestra un enlace intra-anclaje selectivamente escindible (647) que limita el anclaje enlazando el primer y segundo restos terminales. Los grupos conectores estan posicionados para fomentar la reticulacion de los extremos de anclaje entre los sustratos de monomero y prevenir la reticulacion a traves de un sustrato de monomero.
El bucle de anclaje mostrado aqrn tiene tres indicadores (900,901,902), que tambien pueden ser espedficos de especies de motivos, pero requiere un metodo para enlazarse correctamente con las bases correctas en el esqueleto primario.
La Figura 64E muestra la construccion de sustrato despues de la incorporacion en el Xpandomero producto. Las subunidades se escinden y se expanden y se enlazan por enlaces x1 inter-anclajes (930,931), y enlaces %2 inter- anclajes (932,933). Cada subunidad es un anclaje enlazado a un sustrato de monomero y conectado sobre el siguiente enlace %\ Una subunidad se indica por lmeas de puntos que agrupan verticalmente la subunidad de repeticion, como se representa por los corchetes en la Figura 64C adjunta.
En el producto de Xpandomero de la Figura 64E, el esqueleto primario se ha fragmentado y no es covalentemente contiguo debido a que cualquier enlace directo entre los sustratos de subunidades adyacentes se ha escindido. Mediante el proceso de escision, el Xpandomero limitado se libera para convertirse en el producto de Xpandomero. Los miembros de anclaje que estuvieron anteriormente en la configuracion limitada estan ahora en la configuracion expandida, sirviendo asf para estirar linealmente la informacion de secuencias de la diana molde. La expansion de los anclajes reduce la densidad lineal de la informacion de secuencias a lo largo del Xpandomero y proporciona una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion y descodificacion de la secuencia molde.
Aunque el anclaje se representa como una construccion de indicador con tres grupos indicadores, diversas construcciones de indicador pueden estar presentes sobre el anclaje, y pueden comprender indicadores individuales que identifican monomero o el anclaje puede ser un polfmero desnudo. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
La Figura 65 demuestra un metodo de smtesis de Xpandomeros usando construcciones de sustrato RT-NTP de clase IX. Primero se selecciona un molde diana (650) y se hibrida con un cebador inmovilizado. En la etapa I, el cebador se extiende por smtesis dirigida por molde de una hebra hija. Este proceso continua en la etapa II, y en la Figura 65a, se muestra una vista ampliada (flecha de puntos) de la hebra hija. Se ilustran la hebra molde, cebador y construcciones de sustrato de nucleobase de clase IX polimerizadas (sin anclajes), cada construccion de sustrato con funcionalidades qrnmicas, representados como los sfmbolos de cerradura y llave, para la adicion qmmica de reactivos de anclaje. Las funcionalidades se seleccionan de manera que cada monomero tenga un sitio de union del
5
10
15
20
25
30
35
40
45
50
55
anclaje espedfico de base y un sitio de union universal. En la etapa III se introducen anclajes en horquilla con cuatro conectores espedficos de especie. Los anclajes se enlazan al esqueleto primario en un modo de base espedfica segun los conectores espedficos de base como se muestra en la Figura 65b, una vista ampliada (flecha de puntos). Aqm, drculos blancos y negros indican la qmmica de union qmmica universal y las formas de diamante y tenedor indican las qmmicas de union espedfica de base. En la etapa IV y la Figura 65c, una vista ampliada (flecha de puntos), despues de completarse todo el enlace espedfico de base, provoca que los conectores universales formen enlaces. Observese que los conectores universales sobre ambos anclajes y el esqueleto primario estan en estrecha proximidad a su homologo de conector espedfico de base para evitar errores de enlace. Se muestra que la union qmmica de los reactivos de anclaje se ha completado, y se ha formado un Xpandomero limitado sobre el molde. El Xpandomero se libera entonces (no mostrado) por disociacion del molde, y escindiendo los enlaces selectivamente escindibles (de esqueleto primario y enlaces intra-anclaje).
Construcciones monomericas de clase X
Las construcciones de sustrato de clase X, tambien llamadas XNTP, se diferencian de RT-NTP en que el anclaje esta contenido dentro de cada sustrato de monomero para formar un anclaje intra-sustratos, teniendo cada sustrato XNTP un enlace selectivamente escindible dentro del sustrato que, una vez escindido, permite la expansion del anclaje limitado. En la Figura 66, los presentes inventores describen construcciones de sustrato monomerico de clase X en mas detalle. Las Figuras 66A a 66C se leen de izquierda a derecha, mostrando primero la construccion de sustrato monomerico (precursor de Xpandomero que tiene un unico residuo de nucleobase), luego la hebra hija del duplex intermedia en el centro, y a la derecha el producto de Xpandomero preparado para la secuenciacion.
Como se muestra en la Figura 66A, la construccion de sustrato monomerico de clase X tiene un residuo de nucleobase del sustrato, N, que tiene dos restos (662,663) separados por un enlace selectivamente escindible (665), uniendose cada resto a un extremo de un anclaje (660). Los extremos del anclaje pueden unirse a modificaciones del grupo conector sobre el heterociclo, el grupo ribosa, o el esqueleto de fosfato. El sustrato de monomero tambien tiene un sitio de escision intra-sustrato posicionado dentro del esqueleto de fosfororribosilo de forma que la escision proporcione la expansion del anclaje limitado. Por ejemplo, para sintetizar un monomero de ATP de clase X, el conector de amino sobre 8-[(6-amino)hexil]-amino-ATP o N6-(6-amino)hexil-ATP puede usarse como un primer punto de union del anclaje, y, un conector de esqueleto mixto, tal como la modificacion no conectora (N-1- aminoalquil) fosforamidato o (2-aminoetil) fosfonato, puede usarse como un segundo punto de union del anclaje. Ademas, una modificacion de esqueleto conectora tal como un fosforamidato (3' O-P-N 5') o un fosforotiolato (3' OPS 5'), por ejemplo, puede usarse para la escision qmmica selectiva del esqueleto primario.
R1 y R2 son grupos terminales configurados segun convenga para el protocolo de smtesis en el que se usa la construccion de sustrato. Por ejemplo, R1 = 5'-trifosfato y R2 = 3'-OH para un protocolo de polimerasa I. El R1 5' trifosfato puede incluir modificaciones de esqueleto mixtas, tales como un fosfonato de aminoetilo o 3'-O-P-S-5' fosforotiolato, para permitir el enlace del anclaje y la escision del esqueleto, respectivamente. Opcionalmente, R2 puede configurarse con un grupo de bloqueo reversible para la adicion dclica de un unico sustrato. Alternativamente, R1 y R2 pueden configurarse con los grupos conectores terminales para el acoplamiento qmmico. R1 y R2 pueden ser del tipo general XR, en la que X es un grupo de enlace y R es un grupo funcional.
Durante el ensamblaje, la construccion de sustrato monomerico se polimeriza sobre el extremo extensible de la hebra hija naciente por un proceso de polimerizacion dirigida por molde usando un molde monocatenario como gma. Generalmente, este proceso se inicia a partir de un cebador y avanza en la direccion de 5' a 3'. Generalmente, se usa una ADN polimerasa u otra polimerasa para formar la hebra hija, y las condiciones se seleccionan de manera que se obtenga una copia complementaria de la hebra molde.
Como se muestra en la Figura 66B, los residuos de nucleobase se polimerizan una subunidad con la siguiente y forman un producto intermedio llamado la “hebra hija de duplex”. El esqueleto primario (-N-)k, hebra molde (-N'-)k y anclaje (T) se muestran como una hebra hija duplexada, en la que k indica una pluralidad de subunidades de repeticion. Cada subunidad de la hebra hija es un “motivo” de repeticion y los motivos tienen variabilidad espedfica de especie, indicada aqm por el supermdice a. La hebra hija se forma a partir de especies de la construccion de sustrato monomerico seleccionadas por un proceso dirigido por molde de una biblioteca de especies de motivos, uniendose el sustrato de monomero de cada especie de construccion de sustrato a un nucleotido complementario correspondiente sobre la hebra molde diana. De esta forma, la secuencia de residuos de nucleobase (es decir, esqueleto primario) de la hebra hija es una copia complementaria contigua de la hebra molde diana.
La (“V”) mostrada en la Figura 66B encima del residuo de nucleobase indica un enlace selectivamente escindible que divide el sustrato en el primer y segundo restos. Tras la escision, el primer resto (669) de una subunidad seguira enlazado con el segundo resto (668) de la subunidad adyacente y dentro de una subunidad, cada resto se conectara, uno con el otro por el anclaje. Estos son necesariamente selectivamente escindibles para liberar y expandir los anclajes (y el Xpandomero) sin degradar el propio Xpandomero.
La hebra hija tiene dos esqueletos, un “esqueleto primario” y el esqueleto del “Xpandomero limitado”. El esqueleto primario esta compuesto por los sustratos monomericos contiguamente confinados y polimerizados. El “esqueleto de Xpandomero limitado” evita el enlace selectivamente escindible dentro del sustrato de monomero y se forma por los
5
10
15
20
25
30
35
40
45
50
55
enlaces inter-sustratos que enlazan los restos de esqueleto, siendo cada resto de esqueleto un anclaje enlazado a dos restos de los residuo de nucleobase todav^a intactos. El esqueleto de Xpandomero limitado conecta mediante el enlace selectivamente escindible dentro de cada monomero, y seguira covalentemente intacto cuando estos enlaces selectivamente escindibles se escindan y los monomeros se fragmenten en porciones n1 y n2 mostradas en la Figura 66C.
La escision va precedida del acoplamiento enzimatico de los sustratos de monomero para formar el esqueleto primario, con, por ejemplo, enlaces de esqueleto fosfodiester o mixtos entre bases adyacentes. En la estructura mostrada aqm, el esqueleto primario de la hebra hija se ha formado. Despues de disociar o degradar la hebra molde diana y escindir los enlaces selectivamente escindibles, el Xpandomero limitado se libera y se convierte en el producto de Xpandomero. Metodos para la disociacion de la hebra molde incluyen, por ejemplo, desnaturalizacion por calor.
La Figura 66C es una representacion del producto de Xpandomero de clase X despues de la disociacion de la hebra molde y despues de la escision de los enlaces selectivamente escindibles. La hebra del producto de Xpandomero contiene una pluralidad de subunidades k, en la que k indica la subunidad kn en una cadena de m subunidades que constituyen la hebra hija, en la que k = 1, 2, 3 a m, en la que m>10, generalmente m>50, y normalmente m>500 o >5.000. Cada subunidad esta formada de un anclaje en su configuracion expandida enlazada a porciones n1 y n2 de un sustrato de monomero, y cada subunidad esta enlazada con la siguiente por los enlaces de polimerizacion de monomeros. Cada subunidad, un motivo de subunidad a, contiene informacion genetica espedfica de especie establecida por el ensamblaje dirigido por molde del producto intermedio de Xpandomero (hebra hija).
La Figura 66D muestra la construccion de sustrato como modelo molecular, en la que el miembro de nucleobase (664) esta unido a un primer y segundo resto de la nucleobase, cada resto con un sitio de union al anclaje (662,663). El anclaje (660) comprende grupos indicadores (900,901,902). Un enlace selectivamente escindible que separa los dos restos de la nucleobase se indica por una “V” (665).
La Figura 66E muestra el producto de Xpandomero. Las subunidades comprenden el anclaje expandido (660) unido a las porciones de nucleobase (669,668), mostrada como n1 y n2 en la Figura 66C, cada subunidad unida por enlaces inter-nucleobases. Mediante el proceso de escision, el Xpandomero limitado se libera para convertirse en el producto de Xpandomero. Los miembros de anclaje que estuvieron anteriormente en la configuracion limitada estan ahora en la configuracion expandida, sirviendo asf para estirar linealmente la informacion de secuencias de la diana molde. La expansion de los anclajes reduce la densidad lineal de la informacion de secuencias a lo largo del Xpandomero y proporciona una plataforma para aumentar el tamano y la abundancia de indicadores, que a su vez mejora la senal con respecto al ruido para la deteccion y descodificacion de la secuencia molde.
Aunque el anclaje se representa como una construccion de indicador con tres grupos indicadores, diversas construcciones de indicador pueden estar presentes sobre el anclaje, y pueden comprender indicadores individuales que identifican monomero o el anclaje puede ser un polfmero desnudo. En algunos casos, uno o mas precursores de indicador estan presentes sobre el anclaje, y los indicadores se unen por afinidad o se unen covalentemente tras el ensamblaje del producto de Xpandomero.
La Figura 67 muestra un metodo de ensamblaje de un Xpandomero con las construcciones de sustrato XNTP de clase X. En la primera vista se usa un cebador en horquilla para cebar un molde y el molde se pone en contacto con una polimerasa y sustratos de monomero de clase X. Se muestra en la etapa I que la polimerizacion extiende la hebra hija naciente procesivamente por adicion dirigida por molde de sustratos de monomero. La vista ampliada (Figura 67a) ilustra esto en mas detalle. Se muestra que la hebra hija complementaria a la hebra molde esta compuesta de sustratos de nucleobase modificados con sitio de escision interno (“V”). En la etapa II, el proceso de formacion del producto intermedio de Xpandomero se completa, y en la etapa III, un proceso de escision, disociacion del producto intermedio y la expansion de la hebra hija se muestra en proceso. En la vista ampliada (Figura 67b) se muestra que la escision interna de los sustratos de nucleobase alivia la limitacion sobre los anclajes, que se expanden, alargando el esqueleto del Xpandomero.
EJEMPLO 1.
SfNTESIS DE UNA XSONDA 2MERA QUIMERICA “CA” CON ENLACE INTERNUCLEOTIDICO DE RIBOSIL-5'-3' SELECTIVAMENTE ESCINDIBLE
Las construcciones oligomericas de sustrato estan compuestas de miembros de sonda y miembros de anclaje y tienen una construccion general de “sonda-bucle”. La smtesis del miembro de sonda se lleva a cabo usando metodos bien establecidos de smtesis de oligomeros en fase solida. En estos metodos, la adicion de nucleobases a una cadena de sonda naciente sobre una resina se lleva a cabo con, por ejemplo, qrnmica de fosforamidito (las patentes de EE.UU. N° 4.415.732 y 4.458.066), y pueden sintetizarse economicamente miligramos o gramos de oligomero sintetico usando sintetizadores automatizados facilmente disponibles. La smtesis de oligonucleotidos en fase solida tfpica implica realizar reiterativamente cuatro etapas: desproteccion, acoplamiento, encapuchado y oxidacion. Sin embargo, al menos un enlace en la sonda de una construccion de sustrato de Xsonda de clase I es un enlace selectivamente escindible, y al menos dos restos de sonda se modifican para la aceptacion de un miembro
5
10
15
20
25
30
35
40
45
50
55
de anclaje. El enlace selectivamente escindible se localiza entre los restos de sonda seleccionados para la union del anclaje (es decir, “entre” no debe limitarse a que significa “entre miembros de nucleobase adyacentes” debido a que el primer y segundo puntos de la union del anclaje solo necesitan estar posicionados en cualquier parte sobre un primer y segundo resto de la sonda, respectivamente, estando los restos unidos por el enlace selectivamente escindible). En este ejemplo, un enlace internucleotfdico de ribosil-5'-3', que es selectivamente escindible por ribonucleasa H, es el enlace selectivamente escindible y los dos puntos de union del anclaje son el primer y segundo residuos de nucleobase de una sonda 2mera.
La smtesis de Xsondas modificadas con conector se logra usando fosforamiditos comercialmente disponibles, por ejemplo, de Glen Research (Sterling, VA, EE.UU.), BioGenex (San Ramon, CA, EE.UU.), Dalton Chemical Laboratories (Toronto, Canada), Thermo Scientific (EE.UU.), Link Technologies (RU), y otros, o pueden sintetizarse a medida. Pueden usarse metodos de smtesis bien establecidos para preparar la sonda descrita en la que la nucleobase de 3', que para este ejemplo es un modificador de amino C6-desoxiadenosina, se une primero a un soporte universal usando 5'-dimetoxitritil-N6-benzoil-N8-[6-(trifluoroacetilamino)-hex-1-il]-8-amino-2'- desoxiadenosina-3'-[(2-cianoetil)-(N,N-diisopropil)]-fosforamidito, seguido de la adicion de un modificador de amino C6-citidina usando 5'-dimetoxitritil-N-dimetilformamidina-5-[N(trifluoroacetilaminohexil)-3-acrilimido]-citidina,3'-[(2- cianoetil)-(N,N-diisopropil)]-fosforamidito, en la que la 5'-citidina es un ribonucleotido. La adicion de un reactivo de fosforilacion qrnmica seguido de metodos estandar de escision, desproteccion y de purificacion completa la smtesis. El producto de dinucleotido es un 5'-fosfato (aminoC6-citosina) (aminoC6-desoxiadenosina) 3' con un enlace ribosil- 5', 3' centralmente escindible y conectores de amino sobre cada base.
El anclaje de Xsonda para este ejemplo se construye a partir de ester de bis-N-succinimidil-[pentaetilenglicol] (Pierce, Rockford IL; Producto N° 21581). Las aminas conectoras del oligomero de pCA modificado se reticulan con bis(NHS)PEG5 segun las instrucciones del fabricante. Se obtiene un producto del peso molecular esperado para la construccion circularizada de PEG-sonda.
EJEMPLO 2.
SfNTESIS DE UNA XSONDA 4MERA “TATA” CON ENLACE FOSFOROTIOLATO SELECTIVAMENTE ESCINDIBLE
Pueden sintetizarse Xsondas 4meras con un enlace fosforotiolato como el enlace selectivamente escindible. Para el siguiente ejemplo se describe la smtesis de un tetranucleotido 5' fosfato (dT) (aminoC6-dA) (dT) (aminoC6-dA) 3'.
Primero se prepara una 5' mercapto-desoxitimidina como se describe por Mag et al. (“Synthesis and selective cleavage of an oligodeoxynucleotide containing a bridged internucleotide 5'-phosphorothioate linkage”, Nucl Acids Res 19:1437-41, 1991). Se hace reaccionar timidina con dos equivalentes de cloruro de p-toluenosulfonilo en piridina a temperatura ambiente, y el 5'-tosilato resultante se afsla por cristalizacion en etanol. El tosilato se convierte en una 5'-(S-tritil)-mercapto-5'-desoxi-timidina con cinco equivalentes de tritiltiolato de sodio (preparado in situ). El nucleotido 5'-(S-tritil)-mercapto-timidina se purifica y se hace reaccionar con 2-cianoetoxi-bis-(N,N-diisopropilamino-fosfano) en presencia de tetrazol para preparar el elemento estructural de 3'-O-fosforamidito.
Para empezar la smtesis automatizada, el modificador de amino C6-desoxiadenosina se une primero a un soporte universal usando 5'-dimetoxitritil-N6-benzoil-N8-[6-(trifluoroacetilamino)-hex-1-il]-8-amino-2'-desoxiadenosina-3'-[(2- cianoetil)-(N,N-diisopropil)]-fosforamidito, seguido de la adicion de mercaptotimidina fosforamidito preparado anteriormente. Antes de anadir el siguiente amino C6 dA fosforamidito, el grupo S-tritilo se desprotege primero con nitrato de plata acuoso 50 mM y la resina se lava con agua. Entonces, la resina se trata normalmente con un agente reductor tal como DTT para eliminar disulfuros secundarios formados durante la escision. La columna se lava entonces de nuevo con agua y con acetonitrilo, y el tiol libre se hace reaccionar bajo condiciones estandar con la amino C6 desoxiadenosina fosforamidito en presencia de tetrazol, formando asf “ATA” con un enlace fosforotiolato conector S3'^P5' entre la desoxiadenosina terminal y la 3-mercapto-timidina. En el siguiente ciclo se anade desoxitimidina fosforamidito estandar. Finalmente, la adicion de un reactivo de fosforilacion qrnmica, seguido de metodos de escision, desproteccion y de purificacion convencionales, completa la smtesis. El producto de tetranucleotido es un 5' fosfato (dT) (aminoC6-dA) (dT) (aminoC6-dA) 3'.
El enlace fosforotiolato es selectivamente escindible, por ejemplo, con AgCl, acido o con yodoetanol (Mag et al,. “Synthesis and selective cleavage of an oligodeoxynucleotide containing a bridged internucleotide 5'- phosphorothioate linkage”, Nucleic Acids Research, 19(7):1437-1441, 1991). Debido a que el enlace selectivamente escindible es entre la segunda y tercera nucleobases, el anclaje se disena para conectar este enlace, y puede unirse a cualesquiera dos nucleobases (o cualesquiera dos puntos de union del esqueleto primario) sobre cualquier lado del enlace selectivamente escindible. Los metodos para las qmmicas de conector cero y conector incluyen, por ejemplo, provision de conectores con aminas primarias usadas en la smtesis del oligomero, como se describe en el Ejemplo 1. Los conectores modificados con amina sobre el oligomero “TATA” normalmente se protegen durante la smtesis de oligomeros y se desprotegen en el transcurso normal de completarse la smtesis de oligonucleotidos.
El anclaje de Xsonda para este ejemplo se construye entonces a partir de eter diglicidflico de poli(etilenglicol) activado con bis-epoxido (SigmaAldrich, St. Louis MO, Producto N° 475696). La reaccion de epoxido de las aminas
5
10
15
20
25
30
35
40
45
50
55
con los grupos terminales PEG activados se realiza en disolucion diluida para minimizar cualquier reaccion de concatenacion de competicion. Se obtiene reactividad similar con antndridos mixtos o incluso cloruros de acido, y pueden emplearse grupos de enlace heterobifuncionales de manera que orienten la union del anclaje. Los productos de reaccion anclados se separan por HPLC preparativa y se caracterizan por espectroscopfa de masas. Se obtiene un producto del peso molecular aproximado para la construccion 4mera circularizada de PEG-sonda (aproximadamente 2,5 Kd). Con este metodo se obtiene una distribucion de anclajes de PEG con aproximadamente Mn = 500. Esto se corresponde con un anclaje de aproximadamente 40 Angstroms (a aproximadamente 3,36 A/unidad de PEG).
EJEMPLO 3.
SfNTESIS DE UNA XSONDA 3MERA “CTA” CON ENLACE 5'-3' FOSFODIESTER SELECTIVAMENTE ESCINDIBLE
Tambien pueden sintetizarse Xsondas con un enlace fosfodiester como el enlace selectivamente escindible. Para el siguiente ejemplo se describe la smtesis de un trinucleotido de 5' fosfato (aminoC6-dC) (aminoC6-dT) (dA) 3' con una modificacion de fosforotioato no conectora. Los enlaces fosfodiester son atacados por una variedad de nucleasas. Un enlace fosforotioato, con azufre no conector, se usa como enlace resistente a nucleasas en este ejemplo.
Para la smtesis automatizada en la direccion 3' a 5' se usa un soporte solido de desoxiadenosina inmovilizado en CPG (5'-dimetoxitritil-N-benzoil-2'-desoxiadenosina, 3'-succinoil-alquilo de cadena larga-CPG 500). En el primer ciclo, el modificador de amino C6-desoxitimidina fosforamidito (5'-dimetoxitritil-5-[N-(trifluoroacetilaminohexil)-3- acrilimido]-2'-desoxiuridina,3'-[(2-cianoetil)-(N,N-diisopropil)]-fosforamidito) se acopla. Antes del encapuchado, la dA inmovilizada se hace reaccionar con reactivo sulfurizante (Glen Research, Sterling VA; Cat N° 40-4036), tambien conocido como reactivo de Beaucage, siguiendo el protocolo del fabricante. El reactivo se anade generalmente mediante un puerto separado en el sintetizador. Tras la tiolacion, la C6-desoxi-citidina modificada con amino (5'- dimetoxitritil-N-dimetilformamidina-5-[N-(trifluoroacetilaminohexil)-3-acrilimido]-2'-desoxicitidina, 3'-[(2-cianoetil)-(N,N- diisopropil)]-fosforamidito) se acopla. Antes del encapuchado, la dC inmovilizada se hace reaccionar con reactivo sulfurizante (Glen Research, Sterling VA; Cat N° 40-4036), tambien conocido como reactivo de Beaucage, siguiendo el protocolo del fabricante. La “CTA” 3mera resultante tiene un enlace fosforotioato entre la T y la A, y un enlace fosfodiester entre la C y la T. La adicion de un reactivo de fosforilacion qmmica, seguido de metodos de escision, desproteccion y de purificacion estandar, completa la smtesis.
La resistencia de los enlaces fosforotioato al ataque de nucleasas esta bien caracterizado, por ejemplo, por Matsukura et al (“Phosphorothioate analogs of oligodeoxynucleotides: inhibitors of replication and cytopathic effects of human immunodeficiency virus”, PNAS 84:7706-10, 1987), por Agrawal et al (“Oliogodeoxynucleoside phosphoramidates and phosphorothioates as inhibitors of human immunodeficiency virus”, PNAS 85:7079-83, 1988), y en la patente de EE.UU. N° 5770713. Tanto C y T estan modificados con conector o con conector cero, sirviendo la derivatizacion para la union de un miembro de anclaje.
EJEMPLO 4.
SfNTESIS DE UNA XSONDA 3MERA “ATA” CON ENLACE 5' N-P-O 3' FOSFORAMIDATO SELECTIVAMENTE ESCINDIBLE
El modificador de amino C6-desoxiadenosina se une primero a un soporte universal usando 5'-dimetoxitritil-N6- benzoil-N8-[6-(trifluoroacetilamino)-hex-1-il]-8-amino-2'-desoxiadenosina-3'-[(2-cianoetil)-(N,N-diisopropil)]- fosforamidito, seguido en el siguiente ciclo de la adicion de 5'amino-dT bloqueado con MMT (5'monometoxitritilamino-2'-desoxitimidina). Despues del desbloqueo, el extremo 5'-amino se hace reaccionar con C6-desoxiadenosina fosforamidito modificado con amino bajo condiciones estandar. La adicion de un reactivo de fosforilacion qmmica, seguido de metodos de escision, desproteccion y de purificacion estandar completa la smtesis. El trinucleotido 5' (aminoC6-dA) (O-P-N) (dT) (O-P-O) (aminoC6-dA) 3' tiene un enlace fosforamidato entre la 5' aminoC6-dA y la penultima dT.
Este enlace fosforamidato es selectivamente escindible en condiciones en las que enlaces fosfodiester siguen intactos tratando el oligomero con 80 % de acido acetico como se describe por Mag et al. (“Synthesis and selective cleavage of oligodeoxynucleotides containing non-chiral internucleotide phosphoramidate linkages”, Nucl. Acids Res. 17: 5973-5988, 1989). Uniendo un anclaje para conectar el enlace fosforamidato 5'N-P-O, un Xpandomero que contiene dfmeros de este tipo puede expandirse por escision selectiva de los enlaces fosforamidato del esqueleto primario.
EJEMPLO 5.
SfNTESIS DE UNA XSONDA 6MERA “CACCAC” CON UN ENLACE FOTOESCINDIBLE INTERNO
Despues de la smtesis estandar de 3' a 5' con desoxicitosina y desoxiadenosina fosforamiditos sin modificar, se acopla C6 dC modificada con amina (5'-dimetoxitritil-N-dimetilformamidina-5-[N-(trifluoroacetilaminohexil)-3-
5
10
15
20
25
30
35
40
45
50
55
acrilimido]-2'-desoxicitidina,3'-[(2-cianoetil)-(N,N-diisopropil)]-fosforamidito; Glen Research; Cat N° 10-1019), formando as^ un tnmero CAC. Para el siguiente ciclo, se acopla un conector fotoescindible (3-(4,4'-dimetoxitritil)-1-(2- nitrofenil)-propan-1-il-[(2-cianoetil)-(N,N-diisopropil)]-fosforamidito; Glen Research; Cat N° 10-4920). En el siguiente ciclo, se anade una segunda dC modificada con amino, seguido de dos rondas finales de adicion estandar de dA y dC fosforamiditos, respectivamente. El producto resultante, “CAC-pc-CAC” contiene conectores de amino en la tercera y cuarta posiciones de base, y puede modificarse mediante la adicion de un anclaje que conecta el enlace selectivamente escindible formado por la construccion de nitrobenceno fotoescindible entre las dos bases modificadas con amino. La escision selectiva de un esqueleto de fosfodiester modificado con conector fotoescindible se desvela, por ejemplo, por Sauer et al. (“MALDI mass spectrometry analysis of single nucleotide polymorphisms by photocleavage and charge-tagging”, Nucleic Acids Research 31,11 e63, 2003), Vallone et al. (“Genotyping SNPs using a UV-photocleavable oligonucleotide in MALDI-TOF MS”, Methods Mol. Bio. 297:169-78, 2005) y Ordoukhanian et al. (“Design and synthesis of a versatile photocleavable DNA building block, application to phototriggered hybridization”, J. Am. Chem. Soc. 117, 9570-9571, 1995).
EJEMPLO 6.
SfNTESIS DE UNA CONSTRUCCION DE SUSTRATO XMERA
Las construcciones de sustrato Xmeras estan estrechamente relacionadas en diseno y composicion con Xsondas. Se sintetiza una biblioteca Xmera, por ejemplo, por 5'-pirofosforilacion de Xsondas. Procedimientos establecidos para el tratamiento con pirofosfato de 5'-monofosfatos incluyen, por ejemplo, Abramova et al. (“A facile and effective synthesis of dinucleotide 5'-triphoshates”, Bioorganic Medicinal Chemistry 15: 6549-55, 2007). En este metodo, el monofosfato terminal del oligomero se activa segun sea necesario para la reaccion posterior con pirofosfato haciendo reaccionar primero el fosfato terminal como una sal de cetiltrimetilamonio con cantidades equimolares de trifenilfosfina (Ph3P) y disulfuro de 2,2'-dipiridilo (PyS)2 en DMF/DMSO, usando DMAP (4-dimetilaminopiridina) o 1- Melm (1-metilimidazol) como catalizador nucleofilo. El producto se precipita con LiClO4 en acetona y se purifica por cromatograffa de intercambio anionico.
Puede considerarse una variedad de otros metodos para la smtesis robusta de Xmeros de 5'-trifosfato. Como se describe por Burgess y Cook (Chem Rev 100(6):2047-2060), estos metodos incluyen, pero no se limitan a, reacciones usando nucleosido fosforamiditos, smtesis mediante ataque nucleofilo de pirofosfato sobre nucleosido monofosfatos activados, smtesis mediante ataque nucleofilo de fosfato sobre nucleosido pirofosfato activado, smtesis mediante ataque nucleofilo de difosfato sobre fosfato sintona activada, smtesis que implica fosfitos o fosforamiditos activados derivados de nucleosidos, smtesis que implica el desplazamiento directo de grupos salientes 5'-O- por nucleofilos de trifosfato, y metodos biocataltticos. Un metodo espedfico que produjo sustratos de dinucleotido compatibles con polimerasa usa N-metilimidazol para activar el grupo 5'-monofosfato; la posterior reaccion con pirofosfato (sal de tributilamonio) produce el trifosfato (Bogachev, 1996). En otro procedimiento, los trinucleotido fosforamidatos se han sintetizado por Kayushin (Kayushin AL et al. 1996. A convenient approach to the synthesis of trinucleotide phosphoramidites. Nucl Acids Res 24:3748-55).
EJEMPLO 7.
SfNTESIS DE XPANDOMEROS CON ESCISION DE FOSFORAMIDATO POR POLIMERASA
La smtesis de un Xpandomero se realiza usando una construccion de sustrato preparada con extremos 5'-trifosfato y 3'-OH. La patente de EE.UU. N° 7.060.440 a Kless describe el uso de polimerasas para polimerizar oligomeros de trifosfato, y el metodo esta adaptado aqrn para la smtesis de Xpandomeros. La construccion de sustrato consiste en miembro de sonda 2mera “pppCA” con enlace fosforamidato inter-nucleotido 5' N-P-O selectivamente escindible y una construccion de bucle de enlace de PEG. Se sintetiza una hebra molde y cebador acompanante y se purifica antes de uso. La secuencia: “TGTGTGTGTGTGTGTGTGTGATCTACCGTCCGTCCC” se usa como molde. La secuencia “5'GGGACGGACGGTAGAT” se usa como cebador. Se usa una HEX del extremo 5' (5'hexacloro- fluorescema) sobre el cebador como marca. La hibridacion del cebador y el molde forma un molde con cebador de duplex y nucleotido protuberante monocatenario de los extremos 3'-OH y 5' libres de veinte bases en longitud. Entonces se anaden las construcciones de sustrato y la ADN polimerasa T7 recombinante de la marca Sequenase™ (US Biochemicals Corp., Cleveland, OH) y la polimerizacion continua durante 30 min en condiciones ajustadas para la polimerizacion optima. Se mezcla una muestra de la reaccion de polimerizacion con tampon de carga de gel y se somete a electroforesis sobre un gel de 20 % de TBE-acrilamida (Invitrogen, EE.UU.) junto con un control negativo no de polimerasa y un marcador de MW para confirmar la polimerizacion de Xmeros.
El producto intermedio de Xpandomero se trata con 80 % de acido acetico durante 5 h a temperatura ambiente segun el procedimiento de Mag et al. (“Synthesis and selective cleavage of oligodeoxyribonucleotides containing non-chiral internucleotide phosphoramidate linkages”, Nucl. Acids Res., 17: 5973-88, 1989) para escindir selectivamente los enlaces fosforamidato, que asimismo se confirma por electroforesis.
EJEMPLO 8
SfNTESIS DE XPANDOMEROS CON ESCISION DE FOSFOROTIOATO POR POLIMERASA
Se realiza la smtesis de un Xpandomero usando una construccion de sustrato preparada con extremos 5'-trifosfato y 3'-OH. La patente de EE.UU. N°. 7.060.440 a Kless describe el uso de polimerasas para polimerizar oligomeros de 5 trifosfato. La construccion de sustrato es una “pppCA”. La construccion de sustrato se disena con un enlace de esqueleto de fosforotiolato inter-nucleotido selectivamente escindible y una construccion de bucle de anclaje de PEG 2000. Se sintetiza una hebra molde y cebador acompanante y se purifica antes de uso. La secuencia: “TGTGTGTGTGTGTGTGTGTGATCTACCGTCCGTCCC” se usa como molde diana. La secuencia “5'GGGACGGACGGTAGAT” se usa como cebador. Se usa una HEX del extremo 5' (5'hexacloro-fluorescema) sobre 10 el cebador como marca. La hibridacion del cebador y el molde forma un molde con cebador de duplex y nucleotido protuberante monocatenario de los extremos 3'-OH y 5' libres de veinte bases en longitud. Entonces se anaden las construcciones de sustrato y Therminator™ ADN polimerasa (New England Biolabs, EE.UU.) con tampon y sales optimizadas para la polimerizacion. La polimerizacion continuo durante 60 min en condiciones ajustadas para la polimerizacion optima. Se mezcla una muestra de la reaccion de polimerizacion con tampon de carga de gel y se 15 somete a electroforesis sobre un gel de 20 % de TBE-acrilamida (Invitrogen, EE.UU.) junto con un control negativo no de polimerasa y un marcador de MW para confirmar la polimerizacion de Xmeros.
Los enlaces fosforotiolato del producto intermedio de Xpandomero son selectivamente escindibles, por ejemplo, con AgCl, acido o con yodoetanol (Mag et al,. “Synthesis and selective cleavage of an oligodeoxynucleotide containing a bridged intemucleotide 5'-phosphorothioate linkage”, Nucleic Acids Research, 19(7):1437-1441, 1991). La escision 20 se confirma por electroforesis en gel.
EJEMPLO 9.
SfNTESIS DE XPANDOMEROS QUIMERICOS CON LIGASA
Se realiza la smtesis de un Xpandomero usando una construccion de sustrato preparada con extremos 5'- monofosfato y 3'-OH. La construccion de sustrato es un “5' p dC rA~dC dA 3”' 4mero quimerico en el que la 25 penultima adenosina de 5' es un ribonucleotido y el resto del sustrato es desoxirribonucleotido. La construccion de sustrato se disena con un enlace ribosil 5'-3' fosfodiester inter-nucleotido selectivamente escindible (como se muestra por “~”) y una construccion de bucle de anclaje de PEG 2000, en la que el anclaje esta unido a la “C” y “A” terminal del 4mero. Se sintetiza una hebra molde y cebador acompanante y se purifica antes de uso. La secuencia: “TGTGTGTGTGTGTGTGTGTGATCTACCGTCCGTCCC” se usa como molde diana. La secuencia 30 “5'GGGACGGACGGTAGAT” se usa como cebador. Se usa una HEX del extremo 5' (5'hexacloro-fluorescema) sobre el cebador como marca. La hibridacion del cebador y el molde forma un molde con cebador de duplex y nucleotido protuberante monocatenario de los extremos 3'-OH y 5' libres de veinte bases en longitud. Entonces se anaden las construcciones de sustrato y ADN ligasa T4 (Promega Corp, Madison, WI, EE.UU.; Cat N° M1801) con temperatura, tampon y sales optimizadas para la hibridacion y ligacion de sondas transitoria. La ligacion continua durante 6 horas. 35 Una muestra de la reaccion de ligacion se mezcla con tampon de carga de gel y se somete a electroforesis sobre un gel de 20 % de TBE-acrilamida (Invitrogen, Carlsbad, CA, EE.UU.) junto con un control negativo no de ligasa y un marcador de MW para confirmar la ligacion de Xsondas.
En una segunda etapa, el producto intermedio de Xpandomero se trata con ribonucleasa H para escindir el enlace fosfodiester 5'-3' labil a RNasa para producir un producto de Xpandomero que se confirma asimismo por 40 electroforesis en gel.
EJEMPLO 10.
PREPARACION DE UNA CONSTRUCCION DE CONECTOR DE ALFA-FOSFATO
Tambien pueden unirse conectores de anclaje al diester de fosforotioato S o a una N-amida de fosforamidato, como se trata por Agrawal (“Site specific functionalization of oligonucleotides for attaching two different reporter groups”, 45 Nuc. Acids Res. 18:5419-23, 1990). Se desvela un metodo de funcionalizacion de dos enlaces de esqueleto inter- nucleotido diferentes: conector de fosforamidato de aminohexilo (N-1 amino alquilo) y fosforotioato. La amina C6 preparada como se describe por Agrawal se usa como conector para la smtesis de una construccion de anclaje inter-nucleobase de la presente invencion. Tambien se ha informado de la derivatizacion de enlaces N3'-P5' (Sinyakov et al., “Functionalization of the oligonucleotides containing an internucleotide phosphoramidate bond”, 50 Russian J Bioorganic Chem, 29:100-102, 2003).
EJEMPLO 11.
VfAS HETEROBIFUNCIONALES PARA LAS CONSTRUCCIONES DE ANCLAJE
La smtesis de oligomeros modificados que contienen un enlace selectivamente escindible se describen en los Ejemplos 1-5. Aqrn, un 4mero con una base modificada con C6-amino en la segunda posicion y base modificada con 55 conector de 4-formilbenzoato en la tercera posicion del 4mero se prepara por qmmica sintetica de oligomeros
estandar. La segunda y tercera bases se separan por un enlace selectivamente escindible seleccionado de enlace ribosil 5'-3' fosfodiester, enlace desoxirribosil 5'-3' fosfodiester, enlace fosforotiolato (5' O-P-S 3' o 5' S-P-O 3'), enlace fosforamidato (5' O-P-N 3' o 5' N-P-O 3'), o un enlace fotoescindible. La amina del conector C6 se hace reaccionar con sulfo-EGS para formar un grupo NHS de ester activo. La smtesis de bucles de anclaje 5 heterobifuncionales se lleva entonces a cabo haciendo reaccionar el miembro de sonda modificado con un anclaje funcionalizado con grupos terminales del extremo amina y hidrazida. Se obtiene un producto final circularizado en el anclaje.
EJEMPLO 12.
CONSTRUCCION DE ANCLAJE MARCADO CON COLORANTE
10 Se prepara una construccion de sustrato de Xsonda con un unico indicador. Se sintetiza primero un 2mero con C6 aminas sobre la primera y segunda bases usando metodos convencionales. La primera y segunda bases se separan por un enlace selectivamente escindible seleccionado de enlace ribosil 5'-3' fosfodiester, enlace desoxirribosil 5'-3' fosfodiester, enlace fosforotiolato (5' O-P-S 3' o 5' S-P-O 3'), enlace fosforamidato (5' O-P-N 3' o 5' N-P-O 3'), o un enlace fotoescindible. En este ejemplo, el anclaje es una molecula de PEG 2000 funcionalizada en los extremos 15 espedfica de especie con un unico grupo conector interno, que en este caso es un anclaje localizado centrado de
conector funcionalizado con maleimido. El indicador es un dendnmero marcado con colorante unido con el grupo conector de maleimido sobre el anclaje mediante un resto sulfhidrilo sobre el dendnmero. La construccion de indicador resultante contiene asf un indicador sobre el anclaje. Un dendnmero de cistamina (Dendritic Nanotechnologies, Mt Pleasant, MI, USA; Cat N° DNT-294 G3) con un diametro de 5,4 nm y 16 aminas superficiales 20 por medio dendnmero) se usa como indicador. Uniendo colorantes espedficos, o combinaciones de colorantes, a los grupos amina sobre el dendnmero, la especie de construccion de sustrato esta unicamente marcada para la identificacion.
EJEMPLO 13.
CONSTRUCCION DE ANCLAJE MARCADO CON PEPTIDO
25 Se prepara una construccion de sustrato de Xsonda con un unico indicador. Se sintetiza primero un 2mero con C6 aminas sobre la primera y segunda bases usando metodos convencionales. La primera y segunda bases se separan por un enlace selectivamente escindible seleccionado de enlace ribosil 5'-3' fosfodiester, enlace desoxirribosil 5'-3' fosfodiester, enlace fosforotiolato (5' O-P-S 3' o 5' S-P-O 3'), enlace fosforamidato (5' O-P-N 3' o 5' N-P-O 3'), o un enlace fotoescindible. En este ejemplo, el anclaje es una molecula de PEG 2000 funcionalizada en los extremos 30 espedfica de especie con un unico grupo conector interno, que en este caso es un anclaje localizado centrado de
conector funcionalizado con maleimido. El indicador es un dendnmero marcado con colorante unido con el grupo conector de maleimido sobre el anclaje mediante un resto sulfhidrilo sobre el dendnmero. La construccion de indicador resultante contiene asf un indicador sobre el anclaje. Un dendnmero de cistamina (Dendritic Nanotechnologies, Mt Pleasant, MI, USA; Cat N° DNT-294 G3) con un diametro de 5,4 nm y 16 aminas superficiales 35 por medio dendnmero) se usa como indicador. Uniendo colorantes espedficos, o combinaciones de colorantes, a los
grupos amina sobre el dendnmero, la especie de construccion de sustrato esta unicamente marcada para la identificacion. Uniendo peptidos espedficos con el dendnmero, que esta funcionalizado con amina, la especie de construccion de sustrato se marca para la posterior identificacion. Las dimensiones y la carga de los peptidos unidos se usan como caractensticas de deteccion en un aparato de deteccion.
40 EJEMPLO 14.
VfA HETEROBIFUNCIONAL PARA CONSTRUCCIONES DE ANCLAJE DE INDICADOR
Se preparan construcciones de sustrato con multiples indicadores. Una biblioteca de 2meros con base modificada con C6-amino en la primera posicion y base modificada con 4'-formilbenzoato (4FB) en la segunda posicion del 2mero se prepara por qmmica organica estandar. La primera y segunda bases se separan por un enlace 45 selectivamente escindible seleccionado de enlace ribosil 5'-3' fosfodiester, enlace desoxirribosil 5'-3' fosfodiester, enlace fosforotiolato (5' O-P-S 3' o 5' S-P-O 3'), enlace fosforamidato (5' O-P-N 3' o 5' N-P-O 3'), o un enlace fotoescindible. La amina se hace reaccionar con sulfo-EGS para formar un grupo NHS de ester activo. En una segunda etapa, un segmento de indicador de amina bifuncional espedfico de especie (segmento 1) se hace reaccionar con el grupo NHS activo y un segmento de indicador de hidrazida bifuncional espedfico de especie 50 (segmento 4) se hace reaccionar con 4FB. A continuacion, la amina libre sobre el segmento 1 se hace reaccionar con sulfo-EGS para formar un NHS de ester activo. A continuacion se hace reaccionar un encapuchado heterobifuncional espedfico de especie que consiste en un par de segmentos de indicador (segmentos 2 y 3) con grupos terminales amina y 4FB con la construccion, cerrando el bucle de anclaje.
La construccion de indicador resultante contiene asf cuatro indicadores sobre la construccion de anclaje. En este 55 ejemplo, los indicadores son dendrones de poliamina con un conector de cistamina para unir covalentemente a cada segmento de polfmero por enlaces tioeter (Dendritic Nanotechnologies, Mt Pleasant MI, EE.UU.; Cat N° DNT-294: G4, 4,5 nm de diametro, 32 aminas superficiales por medio dendnmero) y los miembros de polfmero son PEG 2000 de extremos funcionalizados, cada uno con un grupo conector interno. Cada segmento de anclaje comprende un
unico indicador. Con cuatro segmentos direccionalmente acoplados, estan disponibles 24 combinaciones posibles de codigo de indicador.
EJEMPLO 15.
VfA HETEROBIFUNCIONAL PARA CONSTRUCCIONES DE INDICADOR CON MARCADO POST-SfNTESIS
5 Se preparan construcciones de sustrato con multiples indicadores. Se prepara un 4mero con base modificada con C6-amino en la primera posicion y base modificada con 4'-formilbenzoato (4FB) en la segunda posicion del 2mero por qrnmica organica estandar. La segunda y tercer bases se separan por un enlace selectivamente escindible seleccionado de enlace ribosil 5'-3' fosfodiester, enlace desoxirribosil 5'-3' fosfodiester, enlace fosforotiolato (5' O-P- S 3' o 5' S-P-O 3'), enlace fosforamidato (5' O-P-N 3' o 5' N-P-O 3'), o un enlace fotoescindible. La amina se hace 10 reaccionar con sulfo-EGS para formar un grupo NHS de ester activo. En una segunda etapa, un segmento de indicador de amina bifuncional espedfico de especie (segmento 1) se hace reaccionar con el grupo NHS activo y se hace reaccionar un segmento de indicador de hidrazida bifuncional espedfico de especie (segmento 4) con 4FB. A continuacion, la amina libre en el segmento 1 se hace reaccionar con sulfo-EGS para formar un NHS de ester activo. Entonces, un encapuchado heterobifuncional espedfico de especie que consiste en un par de segmentos de 15 indicador (segmentos 2 y 3) con grupos terminales amina y 4FB se hace reaccionar con la construccion, cerrando el bucle de anclaje.
La construccion de indicador resultante contiene asf cuatro indicadores sobre la construccion de anclaje. En este ejemplo se describe el post-marcado de la construccion de anclaje. Covalentemente unido a cada segmento de anclaje esta un oligomero 16mero que se usa para la union del indicador. Cada segmento de anclaje esta 20 compuesto en parte de una molecula de PEG funcionalizada. El indicador es dendnmero de poliamina marcado con colorante con un conector de cistamina (Dendritic Nanotechnologies, Mt Pleasant MI, EE.UU.; Cat N° DNT-294: G5, 4,5 nm de diametro, 64 aminas superficiales por medio dendnmero) para el acoplamiento con la sonda de oligomero 16mera. Tras el ensamblaje del Xpandomero, los dendnmeros marcados con colorante se hibridan con los segmentos de anclaje oligomericos. Este enfoque de marcado es analogo al metodo descrito por DeMattei et al. 25 (“Designed Dendrimer Syntheses by Self-Assembly of Single-Site, ssDNA Functionalized Dendrons”, Nano Letters, 4:771-77, 2004).
EJEMPLO 16.
ELEMENTOS INDICADORES MARCADOS CON COLORANTE
Con referencia a los Ejemplos 14 y 15, las aminas superficiales de los elementos indicadores dendnmeros se 30 marcan por qrnmica de ester activo. Estan disponibles Alexa Fluor 488 (verde) y Alexa Fluor 680 (rojo) para la union de una etapa como esteres activos de sNHS de Molecular Probes (Eugene OR). La densidad y relacion de los colorantes se vanan para producir una marca molecular distintiva sobre cada elemento indicador.
EJEMPLO 17.
ELEMENTOS INDICADORES MULTI-ESTADO
35 Se seleccionan diversas paletas de colorantes por tecnicas similares a aquellas usadas en M-FISH y SKY, como se conoce para aquellos expertos en la materia, y se conjugan con un indicador dendnmero. Asf, el elemento indicador de cada anclaje constituye una “direccion espectral”, por lo que una construccion dendnmera unica con una multiplicidad de sitios de union del colorante puede crear una pluralidad de codigos de indicador. Con referencia a la construccion de anclaje descrita en los Ejemplos 14 y 15, una direccion espectral de 5 estados produce 625 40 combinaciones de codigo de indicador.
EJEMPLO 18.
ANCLAJE DE ESPACIADOR PEG-5000
Se construyen segmentos de anclaje de un polfmero duradero soluble en disolvente acuoso/organico que posee de poca a ninguna afinidad de union por reactantes de SBX. Se usa PEG 5000 modificado para los espaciadores de 45 anclaje flexibles que flanquean un indicador de poli-lisina 5000. Los extremos de PEG libres estan funcionalizados para la union al miembro de sonda. El polfmero se circulariza por reticulacion a puntos de union de sonda usando qrnmica de conectores heterobifuncionales.
EJEMPLO 19.
PREPARACION DE UNA COMPOSICION DE INDICADOR DE MARCA DE MASA
50 Se sintetiza un anclaje del siguiente modo: Marcas de masa escindibles se acoplan covalentemente a dendnmeros G5 funcionalizados con el peptido poli-l-lisina (Dendritic Nanotechnologies, Mt Pleasant MI) usando qrnmica de acoplamiento de amina estandar. Los dendnmeros G5 tienen ~5,7 nm de diametro y proporcionan 128 grupos superficiales reactivos. Una tira de diez dendnmeros G5 funcionalizados con peptidos de polilisina de 10.000 de
5
10
15
20
25
30
35
40
45
50
peso molecular proporciona aproximadamente 100.000 sitios de union de indicador conjuntamente en un segmento de dendnmero de ~ 57 nm. Estan disponibles un total de aproximadamente 10.000 marcas de masa para la deteccion sobre el segmento completamente ensamblado, suponiendo solo el 10% de ocupacion de los sitios de union disponibles. Usando el metodo de codificacion de 3 indicadores de marca de masa descritos previamente (Figura 37), aproximadamente 3.300 copias de cada marca de masa estan disponibles para la medicion. Como alternativa, un unico dendnmero G9 (con 2048 grupos reactivos) funcionalizado con poli-lisina de peso molecular 10.000 tiene disponibles aproximadamente 170.000 sitios de union de marcas de masa en un segmento de 12 nm de la construccion de indicador.
Para detectar una secuencia con marcas de masa, se usa un metodo de liberacion controlada de los indicadores de marca de masa en el punto de medicion por uso de conectores fotoescindibles. La fragmentacion secuencial del anclaje no es necesaria. Los indicadores de marca de masa asociados a cada subunidad del polfmero Xpandomero se miden en una etapa. Por ejemplo, un conjunto de 13 indicadores de marca de masa que oscilan de 350 Dalton a 710 Dalton (es decir, una escala de 30 Dalton de indicadores de marca de masa) tiene 286 combinaciones de tres marcas de masa cada uno. De este modo, uno cualquiera de los 256 4meros diferentes esta asociado a solo una combinacion particular de 3 indicadores de marca de masa. La informacion de secuencias codificada del Xpandomero se detecta facilmente por espectroscopfa de masas de las subunidades. Debido a que las subunidades del Xpandomero estan espacialmente bien separadas, la tecnologfa de manipulacion y deteccion del Xpandomero no necesita ser altamente sofisticada.
EJEMPLO 20.
anAlisis DIRECTO DE CONSTRUCCIONES DE SUSTRATO SIN MARCAR
Se sintetiza una biblioteca de construcciones de sustrato; los anclajes no contienen indicadores. Tras la preparacion de un producto de Xpandomero, las bases individuales del producto de Xpandomero se analizan por espectroscopfa tunel electronica.
EJEMPLO 21.
anAlisis asistido por hibridacion de construcciones de sustrato sin marcar
Se sintetiza una biblioteca de construcciones de sustrato oligomerico; los anclajes no contienen indicadores. Tras la preparacion de un producto de Xpandomero, un conjunto completo de sondas marcadas se hibridan entonces con el producto de Xpandomero y las sondas duplexadas se analizan secuencialmente.
EJEMPLO 22.
SfNTESIS DE UN TRIFOSFATO DE DESOXIADENOSINA CON ANCLAJE DE LYS-CYS-PEG-POLIGLUTAMATO- PEG-CYS-COOH
Se inmoviliza lisina con una cadena lateral de amino protegida con BOC sobre una resina y se hace reaccionar con un residuo de cistema usando metodos de smtesis de peptidos estandar. La cadena lateral de amino de la lisina sera el grupo funcional reactivo epsilon del anclaje de RT-NTP (vease clase VI, VII). La cistema formara una primera mitad de un enlace disulfuro intra-anclaje. La amina desprotegida sobre la cistema se modifica con SANH (Pierce- Thermo Fisher, USA; Cat N° 22400: Bioconjugate Toolkit) para formar una hidrazida.
Por separado, se prepara un segmento de espaciador a partir de bis-amino PEG 2000 (Creative PEGWorks, Winston Salem NC; Cat N° PSB 330) por funcionalizacion de las aminas libres con C6-SFB (Pierce-Thermo Fisher, EE.UU.; Cat N° 22400: Bioconjugate Toolkit), formando un segmento de espaciador de bis-4FB PEG; el producto se purifica.
El segmento de espaciador de bis-4FB PEG se acopla entonces al conector de hidrazida sobre la cistema, dejando un grupo 4FB como grupo reactivo terminal, y la resina se lava.
Por separado, se prepara un segmento de poliglutamato (cada glutamato derivatizado en el gamma-carboxilo con 5 unidades de PEO de PEG encapuchado con metilo). El extremo C se convierte en una amina con el agente de acoplamiento EDC y diaminohexano. Se usa SANH para formar un segmento de poliglutamato terminado con di- hidrazida, y el producto se purifica. El segmento de poliglutamato terminado con dihidrazida se hace reaccionar con el grupo 4Fb terminal sobre la resina, formando una hidrazida terminal, y la resina se lava.
Por separado, se hace reaccionar un segmento de espaciador de PEG-2000 (con extremos amina y carboxilo, Creative PEGWorks; PHB-930) con SFB para generar un grupo terminal 4FB. Este segmento de espaciador se hace reaccionar con el grupo hidrazida sobre la resina, formando una cadena terminada con carboxilo. La resina se lava de nuevo.
Se acopla un residuo de cistema al carboxilo libre usando smtesis de peptidos reactivos estandar. El carboxilo terminal de la cistema esta protegido con O-bencilo. El producto resultante se lava de nuevo y a continuacion se escinde de la resina. El carboxilo libre generado por escision se modifica entonces con EDC, aminohexilo y SANH
5
10
15
20
25
30
35
40
45
50
para formar una hidrazida reactiva.
Por separado, una desoxiadenosina trifosfato modificada con C6 amina (N6-(6-amino)hexil-dATP, Jena Bioscience, Jena De; Cat N° NU-835) se trata con SFB (Pierce Bioconjugate Toolkit, Cat N° 22419) para formar un grupo funcional 4FB. Combinando la base modificada con la hidrazida reactiva de las etapas precedentes, se ensambla una construccion de sustrato de anclaje-sonda. BOC de la cadena lateral de lisina se elimina antes de uso. Bajo condiciones generalmente oxidantes, las cistemas se asocian para formar un enlace disulfuro intra-anclaje, estabilizando el anclaje en una forma compacta limitada.
EJEMPLO 23.
SfNTESIS DE UNA BIBLIOTECA DE TRIFOSFATO DE RT-NTP
Las bases de nucleotido trifosfato ancladas A, T, C y G con enlace -S-S- intra-anclaje se preparan como se describe en el Ejemplo 22, pero la carga y los parametros ffsicos de los segmentos de glutamato PEGilado usados para cada base se seleccionan para proporcionar una caractenstica de indicador distinta.
EJEMPLO 24.
SfNTESIS DE XPANDOMEROS POR SBE USANDO RT-NTP ANCLADOS CON POLIGLUTAMATO
Se preparan nucleotido trifosfatos de adenosina y guanosina RT-NTP modificados con enlaces disulfuro intra- anclaje. Las bases se modifican adicionalmente de manera que se bloqueen reversiblemente en la posicion 3'. La qmmica de bloqueo reversible basada en alilo es como se describe por Ruparel (“Design and synthesis of a 3'-O-allyl photocleavable fluorescent nucleotide as a reversible terminator for DNA sequencing by synthesis” PNAS, 102:593237, 2005). Los anclajes de las bases modificadas se construyen con grupo funcional delta y grupo funcional epsilon generalmente como se muestra en la Figura 61. El grupo funcional delta es un carboxilo de una cistema lateral del anclaje y el grupo funcional epsilon es una cadena lateral amina de una lisina cerca de la union del anclaje con las purinas. Los anclajes se modifican adicionalmente de manera que contengan segmentos de poliglutamato modificados espedficos de nucleobase.
La secuencia TCTCTCTCTCTCTCTCATCTACCGTCCGTCCC” se usa como molde. La secuencia “5'GGGACGGACGGTAGAT” se usa como cebador. Se usa una HEX del extremo 5' (5'hexacloro-fluorescema) sobre el cebador como marca. El metodo de smtesis de Xpandomeros es esencialmente como se describe para la Figura 61. En un primer ciclo de cebado de SBE, la nucleobase modificada se anade con polimerasa Klenow en condiciones adaptadas para la polimerizacion y se anade una unica base con la hebra hija naciente sobre el extremo 3'-OH del cebador. Debido a que la construccion de sustrato esta bloqueada en la posicion 3', no se produce polimerizacion adicional.
El grupo conector de la cadena lateral de amino (epsilon) sobre el primer RT-NTP anadido esta encapuchado y seguira asf durante la reaccion de SBE. El grupo carboxilo terminal del anclaje se desprotege y el 3' OH sobre el sustrato se desbloquea; el complejo se lava antes de la siguiente ronda de SBE.
En un segundo ciclo de SBE, otra nucleobase se polimeriza con el producto intermedio de Xpandomero naciente. El enlace % se forma entre la amina libre del grupo conector epsilon sobre la primera nucleobase y el grupo conector de carboxilo sobre el anclaje de la segunda nucleobase usando EDC y sulfo-NHS como agente de reticulacion (Pierce Cat N° 22980 y 24510). El carboxilo sobre el grupo conector delta del anclaje se desprotege y el 3' OH sobre el sustrato se desbloquea; el complejo se lava antes de una siguiente ronda de SBE.
El ciclo de SBE puede repetirse multiples veces, formando asf un producto intermedio de Xpandomero en la configuracion limitada. Cada anclaje en la cadena creciente de nucleobases unidas por % esta en la configuracion de Xpandomero limitado.
EJEMPLO 25.
ESCISION POR NUCLEASA Y TCEP PARA FORMAR XPANDOMERO DE CLASE X
El producto intermedio de Xpandomero del Ejemplo 24 se escinde con nucleasa, formando un producto de Xpandomero compuesto de nucleobases individuales enlazadas por segmentos de anclaje y enlaces %. La nucleasa tambien degrada el molde y cualquier cebador asociado, liberando el producto. Los enlaces disulfuro intra-anclaje se escinden mediante la adicion de un agente reductor (TCEP, Pierce Cat. N°. 20490).
El producto de Xpandomero se filtra y se purifica para eliminar sintonas truncadas y productos secundarios de la digestion con nucleasa. La deteccion y el analisis del Xpandomero linealizado pueden hacerse usando una amplia variedad de metodos de generacion existentes y futuros.
5
10
15
20
25
30
35
40
45
50
55
EJEMPLO 26
SfNTESIS DE UNA DESOXIADENOSINA TRIFOSFATO CON UN CONECTOR FOTOESCINDIBLE INTRA- ANCLAJE
Se inmoviliza glicina sobre una resina y se hizo reaccionar con una cistema. A continuacion, el grupo amino de cistema se desprotege y se hace reaccionar con un glutamate, el glutamate con una cadena lateral modificada con un conector fotolabil que termina en un carboxilo protegido con OBencil, tal como un conector de 2-nitroveratrilamina adaptado a partir del descrito por Holmes et al. (“Reagents for combinatorial organic synthesis: development of a new O-nitrobenzyl photolabile linker for solid phase synthesis”, J Org Chem, 60:2318-19, 1995). La cistema sera el “grupo funcional epsilon” del anclaje de RT-NTP. La amina desprotegida sobre el glutamato se modifica con SANH (Pierce-Thermo Fisher, EE.UU.; Cat N° 22400: Bioconjugate Toolkit) para formar una hidrazida. La cadena lateral del glutamato formara un conector intra-anclaje fotoescindible tras la smtesis del anclaje.
Por separado, se prepara un segmento de espaciador a partir de bis-amino PEG 2000 (Creative PEGWorks, Winston Salem, NC, USA; Cat N° PSB 330) por funcionalizacion de las aminas libres con C6-SFB (Pierce Bioconjugate Toolkit, Cat N° 22423), formando un segmento de espaciador de bis-4FB PEG, y el producto se purifica. El segmento de espaciador de bis-4FB PEG se acopla entonces al conector de hidrazida sobre el glutamato, dejando un grupo 4FB como el grupo reactivo terminal, y la resina se lava.
Por separado, se prepara un segmento de poliglutamato (con cadenas laterales protegidas con t-butilo). El extremo C se convierte en una amina con el agente de acoplamiento EDC y diaminohexano. Se usa SANH para formar un segmento de poliglutamato terminado con di-hidrazida, y el producto se purifica. El segmento de poliglutamato terminado con dihidrazida se hace reaccionar con el grupo 4Fb terminal sobre la resina, formando una hidrazida terminal sobre la resina, y la resina se lava.
Se modifica un segmento de espaciador de PEG-2000 (con amino libre y extremos amino protegidos con FMOC; Cat N° PHB-0982, Creative PEGWorks) con C6 SFB para formar un 4FB y segmento de espaciador de PEG modificado con FMOC-amino. El extremo de 4FB se hace reaccionar con el grupo hidrazida sobre la resina, formando una cadena terminada con FMOC-amino. La resina se lava de nuevo.
Se acopla un residuo de lisina a la amina libre del espaciador por un enlace peptfdico. El residuo de lisina se protege sobre la cadena lateral por BOC y la alfa-amina de la lisina se protege por FMOC. A continuacion se desprotegen el carboxilo terminal de OBencilo del conector fotoescindible y la cadena lateral protegida con BOC de la lisina y se reticulan con EDC/sulfo-NHS para circularizar el anclaje.
El producto resultante se lava de nuevo y a continuacion se escinde de la resina. El carboxilo de glicina libre generado por la escision se modifica entonces con EDC, aminohexilo y SANH para formar una hidrazida reactiva.
Por separado, una desoxiadenosina trifosfato modificada con C6 amina (N6-(6-amino)hexil-dATP, Jena Bioscience, Jena De; Cat N° NU-835) se trata con SFB (Pierce Bioconjugate Toolkit, Cat N° 22419) para formar un grupo funcional 4FB. Combinando la base modificada con la hidrazida reactiva de las etapas precedentes se ensambla una construccion de sustrato de anclaje-sonda. El conector intra-anclaje fotoescindible estabiliza el anclaje en una forma compacta limitada. Entonces se elimina FMOC y la amina terminal libre se hace reaccionar con sulfo-EMCS (Pierce; Cat N° 22307) para introducir un grupo funcional maleimido terminal.
EJEMPLO 27.
SfNTESIS DE XPANDOMEROS POR SBE USANDO RT-NTP FOTOESCINDIBLE
Se preparan nucleotido trifosfatos de adenosina y guanosina de RT-NTP modificados con enlaces intra-anclaje fotoescindibles. Las bases se modifican adicionalmente de manera que se bloqueen reversiblemente en la posicion 3'. La qmmica de bloqueo reversible basada en alilo es como se describe por Ruparel (“Design and synthesis of a 3'- O-allyl photocleavable fluorescent nucleotide as a reversible terminator for DNA sequencing by synthesis”, PNAS, 102:5932-37, 2005). Los anclajes de las bases modificadas se construyen con grupo funcional delta y grupo funcional epsilon generalmente como se muestra en la Figura 61. El grupo conector delta es una amina de una lisina lateral terminal del anclaje y el grupo conector epsilon es un sulfhidrilo de una cistema cerca del punto de union del anclaje. Los anclajes se modifican adicionalmente de manera que contengan segmentos de poliglutamato modificados espedficos de especie.
La secuencia TCTCTCTCTCTCTCTCATCTACCGTCCGTCCC” se usa como molde. La secuencia “5'GGGACGGACGGTAGAT” se usa como cebador. Se usa una HEX del extremo 5' (5'hexacloro-fluorescema) sobre el cebador como marca. El metodo de smtesis de Xpandomeros es esencialmente como se ha descrito para la Figura 61. En un primer ciclo de cebado de SBE, la nucleobase modificada (A) se anade con polimerasa de Klenow en condiciones adaptadas para la polimerizacion y se anade una unica base con la hebra hija naciente sobre el extremo 3'-OH del cebador. Debido a que la construccion de sustrato se bloquea en la posicion 3', no se produce polimerizacion adicional. El complejo de cebador-molde inmovilizado se lava entonces para eliminar el sustrato sin reaccionar.
5
10
15
20
25
30
35
40
45
50
El grupo conector de la cadena lateral de sulfhidrilo (epsilon) sobre el primer RT-NTP anadido esta encapuchado y seguira as^ durante la reaccion de SBE. El grupo amino terminal del anclaje se desprotege y el 3' OH sobre el sustrato se desbloquea; el complejo se lava antes de la siguiente ronda de SBE.
En un segundo ciclo de SBE, otra nucleobase (G) se polimeriza con el producto intermedio de Xpandomero naciente. El enlace % se forma entre el amino (grupo conector delta) sobre la primera nucleobase y el sulfhidrilo (grupo conector epsilon) sobre el anclaje de la segunda base usando el reactivo de reticulacion GMBS (Pierce; Cat N° 22309). El grupo conector amino delta sobre el segundo RT-NTP se desprotege y el 3'-OH del sustrato se desbloquea; el complejo se lava antes de la siguiente ronda de SBE.
El ciclo de SBE puede repetirse multiples veces, formando asf un producto intermedio de Xpandomero en la configuracion limitada. Cada anclaje en la cadena creciente de nucleobases unidas por % esta en la configuracion de Xpandomero limitado.
EJEMPLO 28.
NUCLEASA Y FOTOESCISION PARA FORMAR XPANDOMERO DE CLASE X
El producto intermedio de Xpandomero del Ejemplo 27 se escinde con nucleasa, formando un producto de Xpandomero compuesto de nucleobases individuales enlazadas por segmentos de anclaje y enlaces %. La nucleasa tambien degrada el molde y cualquier cebador asociado, liberando el producto. Los enlaces fotoescindibles intra- anclaje se escinden por exposicion a una luz UV.
El producto de Xpandomero se filtra y se purifica para eliminar sintonas truncadas y productos secundarios de la digestion con nucleasa. La deteccion y el analisis del Xpandomero linealizado puede hacerse usando una amplia variedad de metodos de generacion existentes y futuros.
EJEMPLO 29.
SfNTESIS DE UN ANCLAJE DE RT-NTP IN SITU
Usando metodos de smtesis de peptidos estandar sobre un soporte solido, se prepara un peptido que tiene la estructura (Resina-C')-Glu-Cys-(Gly-Ala)io-Pro-Ser-Gly-Ser-Pro-(Ala-Gly)io-Cys-Lys. La amina terminal se hace reaccionar con SANH (Pierce, Cat N° 22400) para crear un conector de hidrazida.
Por separado, una desoxiadenosina trifosfato modificada con C6 amina (N6-(6-amino)hexil-dATP, Jena Bioscience, Jena De; Cat N° NU-835) se trata con SFB (Pierce Bioconjugate Toolkit, Cat N° 22419) para formar un grupo funcional 4FB. Combinando la base modificada con la hidrazida reactiva de las etapas precedentes, se ensambla una construccion de sustrato de anclaje-sonda.
La construccion se escinde a continuacion de la resina. Tras la desproteccion y bajo condiciones generalmente oxidantes, las cistemas se asocian para formar un enlace disulfuro intra-anclaje, estabilizando la horquilla beta, que contiene un carboxilo libre terminal (un grupo conector delta lateral sobre el anclaje) y una lisina cerca del punto de union del anclaje (la amina de la cadena lateral y grupo conector epsilon).
El disulfuro es representativo de la estabilizacion intra-anclaje representada en las construcciones de sustrato de clases II, III, VI, VII y VIII (veanse las Figuras 8 y 9), aunque ilustradas aqrn con referencia mas espedfica a construcciones de sustrato monomerico de clases VI, VII y VIIi. La longitud del anclaje sin plegar, suponiendo una longitud del enlace peptfdico C-C del residuo de 3,8 A, es aproximadamente 10 nm, pero supone una forma compacta debido al enlace de hidrogeno en la horquilla beta.
Como se describe por Gellman (“Foldamers, a manifesto”, Acc Chem Res 31:173-80, 1998), una amplia variedad de polfmeros, no simplemente peptidos, pueden plegarse en formas compactas. Tales polfmeros incluyen oligopiridinas, poliisocianuros, poliisocianatos, metacrilatos de poli(triarilmetilo), polialdehfdos, poliprolina, ARN, oligopirrolinonas y oligoureas, todos los cuales han presentado la capacidad de plegarse en estructuras secundarias compactas y expandirse bajo condiciones adecuadas. Por tanto, los ejemplos de peptidos presentados aqrn son representativos de una clase mucho mayor de qmmicas de anclaje, en la que las limitaciones al anclaje sin expandir pueden incluir enlace de hidrogeno e interacciones hidrofobas, por ejemplo, ademas de reticulaciones intra-anclaje.
EJEMPLO 30.
SfNTESIS DE XPANDOMEROS USANDO XSONDAS
En una realizacion de SBX, una biblioteca de Xsondas de 256 Xsondas 4meras se presenta a una diana de ADN monocatenario anclada y alargada para la hibridacion. La etapa de hibridacion continua bajo un ciclado termico preciso rutinario para promover cadenas de Xsondas largas. Se eliminan duplex de sonda-diana no espedficos debilmente unidos por una simple etapa de lavado, de nuevo bajo control termico preciso. La ligacion enzimatica se realiza para enlazar cualquier cadena de Xsondas a lo largo del ADN diana, seguido de un segundo lavado. Repitiendo el ciclo de hibridacion / lavado / ligacion / lavado, secuencias enlazadas mas largas crecen en multiples
5
10
15
20
25
30
35
40
45
50
55
loci a lo largo del ADN diana hasta que la replicacion del molde diana sea generalmente completa.
Los huecos sin llenar a lo largo del ADN diana se llenan usando una ADN polimerasa bien establecida y proceso de llenado de huecos basado en ligasa (Lee, “Ligase Chain Reaction”, Biologicals, 24(3): 197-199, 1996). Los nucleotidos incorporados en los huecos tienen un codigo de indicador unico para indicar un nucleotido de hueco. El producto intermedio de Xpandomero completado, que esta compuesto por la diana de ADN original con Xsondas complementariamente duplexadas y ligadas con cargas de 1, 2 o 3 huecos de nucleotido ocasionales, se escinde para producir un Xpandomero. El conector escindible para este ejemplo es una modificacion de esqueleto del sustrato 3' OP-N 5'. La escision selectiva se cataliza mediante la adicion de acido acetico a temperatura ambiente.
El Xpandomero se filtra y se purifica para eliminar productos truncados y posteriormente se alarga para formar una estructura lineal de codigos de indicador enlazados. La deteccion y analisis del producto de Xpandomero puede hacerse usando una amplia variedad de metodos existentes.
EJEMPLO 31.
SfNTESIS DE XPANDOMEROS XNTP USANDO POLIMERASA
La smtesis de un Xpandomero de clase X se realiza usando una construccion de sustrato modificada 8-[(6- amino)hexil]-amino-desoxiadenosina trifosfato que tiene un esqueleto mixto que consiste en un fosfonato de 2- aminoetilo no conector y un fosforotiolato conector (3' O-P- S 5') en el fosfato alfa. Un anclaje intra-nucleotido esta unido al conector de fosfonato de 2-aminoetilo y a un conector de C6 amino sobre 8-[(6-amino)hexil]-amino- desoxiATP. La secuencia TTTTTTTTTTTTTTTTTTTTATCTACCGTCCGTCCC” se usa como molde. La secuencia “5'GGGACGGACGGTAGAT” se usa como cebador. Se usa una HEX del extremo 5' (5'hexacloro-fluorescema) sobre el cebador como marca. La hibridacion del cebador y el molde forma un molde con cebador de duplex y nucleotido protuberante monocatenario de los extremos 3'-OH y 5' libres de veinte bases en longitud. Entonces se anaden las construcciones de sustrato y polimerasa y la polimerizacion continua durante 60 min en condiciones ajustadas para la polimerizacion optima. Se mezcla una muestra de la reaccion de polimerizacion con tampon de carga de gel y se somete a electroforesis sobre un gel de 20 % de TBE-acrilamida (Invitrogen, EE.UU.) junto con un control negativo no de polimerasa y un marcador de MW para confirmar la polimerizacion de XNTP.
El producto intermedio de Xpandomero se trata con cation divalente (vease Mag et al. 1991. “Synthesis and selective cleavage of an oligodeoxynucleotide containing a bridged internucleotide 5'-phosphorothioate linkage”, Nucleic Acids Research, 19(7):1437-1441) para escindir selectivamente los enlaces fosforotiolato entre la union del anclaje y la desoxirribosa, que se confirma por electroforesis.
EJEMPLO 32.
SfNTESIS DE XPANDOMEROS XNTP USANDO POLIMERASA
La smtesis de un Xpandomero de clase X se realiza usando una construccion de sustrato modificada N6-(6- amino)hexil-desoxiadenosina trifosfato que tiene un esqueleto mixto que consiste en un (N-1- aminoalquil)fosforamidato no conector y un fosforotiolato conector (3' O-P-S 5') en el fosfato alfa. Un anclaje intra- nucleotido esta unido al grupo N-1-aminoalquilo y a un conector de C6 amino sobre N6-(6-amino)hexil-desoxiATP. La secuencia TTTTTTTTTtTtTTTTTTTTATCTaCcGTCCGTCCC” se usa como molde. La secuencia
“5'GGGACGGACGGTAGAT” se usa como cebador. Se usa una HEX del extremo 5' (5'hexacloro-fluorescema) sobre el cebador como marca. La hibridacion del cebador y el molde forma un molde con cebador de duplex y nucleotido protuberante monocatenario de los extremos 3'-OH y 5' libres de veinte bases en longitud. Entonces se anaden las construcciones de sustrato y polimerasa y la polimerizacion continua durante 60 min en condiciones ajustadas para la polimerizacion optima. Se mezcla una muestra de la reaccion de polimerizacion con tampon de carga de gel y se somete a electroforesis sobre un gel de 20 % de TBE-acrilamida (Invitrogen, EE.UU.) junto con un control negativo no de polimerasa y un marcador de MW para confirmar la polimerizacion de XNTP.
El producto intermedio de Xpandomero se trata con yodoetanol (vease Gish et al (“DNA and RNA sequence determination based on phosphorothioate chemistry”, Science, 240(4858): 1520-1522, 1988) o por escision con cationes metalicos divalentes como se describe por Vyle et al (“Sequence- and strand-specific cleavage in oligodeoxyribonucleotides and DNA containing 3'-thiothymidine”. Biochemistry 31(11): 3012-8, 1992) para escindir selectivamente los enlaces fosforotiolato entre la union del anclaje y la desoxirribosa, que se confirma por electroforesis.
EJEMPLO 33.
SfNTESIS DE XPANDOMEROS XNTP USANDO LIGASA
La smtesis de un Xpandomero de clase X se realiza usando una construccion de sustrato modificada 8-[(6- amino)hexil]-amino-desoxiadenosina monofosfato que tiene un esqueleto mixto que consiste en un fosfonato de 2- aminoetilo no conector y un fosforotiolato conector (3' O-P- S 5') en el fosfato alfa. Un anclaje intra-nucleotido esta unido al conector de fosfonato de 2-aminoetilo y a un conector de C6 amino sobre la 8-[(6-amino)hexil]-amino-
desoxiAMP. La secuencia TTTTTTTTTTTTTTTTTTTTATCTACCGTCCGTCCC” se usa como molde. La secuencia “5'GGGACGGACGGTAGAT” se usa como cebador. Se usa una HEX del extremo 5' (5'hexacloro-fluorescema) sobre el cebador como marca. La hibridacion del cebador y el molde forma un molde con cebador de duplex y nucleotido protuberante monocatenario de los extremos 3'-OH y 5' libres de veinte bases en longitud. Entonces se anaden las 5 construcciones de sustrato y ligasa y la ligacion continua durante 5 horas en condiciones ajustadas para la ligacion. Se mezcla una muestra de la reaccion de ligacion con tampon de carga de gel y se somete a electroforesis sobre un gel de 20 % de TBE-acrilamida (Invitrogen, EE.UU.) junto con un control negativo no de polimerasa y un marcador de MW para confirmar la ligacion de XNTP.
El producto intermedio de Xpandomero se trata con 80 % de acido acetico durante 5 ha temperatura ambiente 10 segun el procedimiento de Mag et al (“Synthesis and selective cleavage of oligodeoxyribonucleotides containing nonchiral internucleotide phosphoramidate linkages”, Nucl. Acids Res. 17: 5973-88, 1989) para escindir selectivamente los enlaces fosforamidato entre el punto de union del anclaje y la desoxirribosa, que se confirma por electroforesis.
Las diversas realizaciones descritas anteriormente pueden combinarse para proporcionar realizaciones adicionales.

Claims (8)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    1. Un metodo para la secuenciacion de un acido nucleico diana, que comprende:
    a) proporcionar una hebra hija producida por una smtesis dirigida por molde, comprendiendo la hebra hija una pluralidad de subunidades acopladas en una secuencia correspondiente a una secuencia de nucleotidos contigua de toda o una porcion del acido nucleico diana, en la que las subunidades individuales comprenden un anclaje, al menos una sonda o residuo de nucleobase, y al menos un enlace selectivamente escindible;
    b) escindir el al menos un enlace selectivamente escindible para dar un Xpandomero de una longitud mayor que la pluralidad de las subunidades de la hebra hija, comprendiendo el Xpandomero los anclajes y elementos indicadores para analizar la informacion genetica en una secuencia correspondiente a la secuencia de nucleotidos contigua de toda o una porcion del acido nucleico diana; y
    c) detectar los elementos indicadores del Xpandomero.
  2. 2. El metodo de la reivindicacion 1, en el que los elementos indicadores para analizar la informacion genetica estan asociados con:
    los anclajes del Xpandomero;
    la hebra hija antes de la escision del al menos un enlace selectivamente escindible; o el Xpandomero despues de la escision del al menos un enlace selectivamente escindible.
  3. 3. El metodo de la reivindicacion 1, en el que el Xpandomero comprende ademas toda o una porcion de la al menos una sonda o residuo de nucleobase.
  4. 4. El metodo de la reivindicacion 3, en el que los elementos indicadores para analizar la informacion genetica son o estan asociados con la al menos una sonda o residuo de nucleobase.
  5. 5. El metodo de la reivindicacion 1, en el que el al menos un enlace selectivamente escindible es:
    un enlace covalente; un enlace intra-anclaje;
    un enlace entre o dentro de las sondas o residuos de nucleobase de la hebra hija; o un enlace entre las sondas o residuos de nucleobase de la hebra hija y un molde diana.
  6. 6. El metodo de la reivindicacion 1, en el que el Xpandomero comprende la siguiente estructura:
    en la que
    imagen1
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres; y
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana;
    imagen2
    en la que
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos
    contigua de una porcion del acido nucleico diana; y X representa un enlace con el anclaje de una subunidad adyacente;
    10
    15
    20
    25
    30
    35
    imagen3
    en la que
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y X representa un enlace con el anclaje de una subunidad adyacente;
    imagen4
    en la que
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y X representa un enlace con el anclaje de una subunidad adyacente;
    imagen5
    en la que
    T representa el anclaje;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y X representa un enlace con el anclaje de una subunidad adyacente;
    imagen6
    imagen7
    en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    5
    10
    15
    20
    25
    30
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y X representa un enlace con el anclaje de una subunidad adyacente;
    imagen8
    en la que
    T representa el anclaje;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y X representa un enlace con el anclaje de una subunidad adyacente;
    imagen9
    en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y X representa un enlace con el anclaje de una subunidad adyacente;
    .x' x
    _ N
    imagen10
    en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana;
    X1 representa un enlace con el anclaje de una subunidad adyacente; y X2 representa un enlace inter-anclaje; o
    imagen11
    en la que
    5
    10
    15
    20
    25
    30
    35
    T representa el anclaje;
    n1 y n2 representa una primera porcion y una segunda porcion, respectivamente, de un residuo de nucleobase; k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez; y
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies comprende informacion de secuencias de la secuencia de nucleotidos contigua de una porcion del acido nucleico diana.
  7. 7. El metodo de la reivindicacion 6, en el que, antes de la escision del al menos un enlace selectivamente escindible, la hebra hija comprende un duplex de molde-hebra hija que tiene la siguiente estructura:
    en la que
    P1~ P2-
    P1'- P2-
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    ~ representa el al menos un enlace selectivamente escindible; P1 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P1 es complementaria;
    P2 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P2 es complementaria;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres; y
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana;
    imagen12
    en la que
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    ~ representa el al menos un enlace selectivamente escindible; P1 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P1 es complementaria;
    P2 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P2 es complementaria;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
    X representa un enlace con el anclaje de una subunidad adyacente;
    5
    10
    15
    20
    25
    30
    I-------
    pi_ p2~
    P1'-P2-
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    ~ representa el al menos un enlace selectivamente escindible;
    P1 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P1 es complementaria;
    P2 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P2 es complementaria;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
    X representa un enlace con el anclaje de una subunidad adyacente;
    imagen13
    en la que
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    ~ representa el al menos un enlace selectivamente escindible; P1 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P1 es complementaria;
    P2 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P2 es complementaria;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
    X representa un enlace con el anclaje de una subunidad adyacente;
    imagen14
    -P’-P2-
    -P’-P2-
    K*
    5
    10
    15
    20
    25
    30
    35
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    ~ representa el al menos un enlace selectivamente escindible;
    P1 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P1 es complementaria;
    P2 representa una secuencia de nucleotidos contigua de al menos un residuo de nucleotido de la hebra molde a la que P2 es complementaria;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a tres;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
    X representa un enlace con el anclaje de una subunidad adyacente;
    imagen15
    en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    N' representa un residuo de nucleotido de la hebra molde al que N es complementario;
    ~ representa el al menos un enlace selectivamente escindible;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
    X representa un enlace con el anclaje de una subunidad adyacente;
    imagen16
    en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    N' representa un residuo de nucleotido de la hebra molde al que N es complementario;
    ~ representa el al menos un enlace selectivamente escindible;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
    X representa un enlace con el anclaje de una subunidad adyacente;
    5
    10
    15
    20
    25
    30
    imagen17
    T representa el anclaje;
    N representa un residuo de nucleobase;
    N' representa un residuo de nucleotido de la hebra molde al que N es complementary ~ representa el al menos un enlace selectivamente escindible;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana; y
    X representa un enlace con el anclaje de una subunidad adyacente;
    imagen18
    en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    N' representa un residuo de nucleotido de la hebra molde al que N es complementario;
    ~ representa el al menos un enlace selectivamente escindible;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez;
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad, en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana;
    X1 representa un enlace con el anclaje de una subunidad adyacente; y X2 representa un enlace inter-anclaje; o
    N
    N'
    en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    N' representa un residuo de nucleotido de la hebra molde al que N es complementario;
    V representa un sitio de escision interno del residuo de nucleobase;
    k representa la subunidad kn en una cadena de m subunidades, en la que m es un numero entero superior a diez; y
    a representa una especie de un motivo de subunidad seleccionado de una biblioteca de motivos de subunidad,
    en la que cada una de las especies es complementaria a la secuencia de nucleotidos contigua de una porcion del acido nucleico diana.
  8. 8. El metodo de la reivindicacion 6, en la que la hebra hija se forma a partir de una pluralidad de construcciones de sustrato de oligomero que tienen la siguiente estructura:
    5
    en la que
    imagen19
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    10 ~ representa el al menos un enlace selectivamente escindible; y
    R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra hija;
    imagen20
    en la que
    15 T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra hija;
    20 s representa un primer grupo conector;
    8 representa un segundo grupo conector; y “------” representa una reticulacion intra-anclaje escindible;
    imagen21
    en la que
    25 T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda; R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra hija; e representa un primer grupo conector;
    30 8 representa un segundo grupo conector; y
    “------” representa una reticulacion intra-anclaje escindible;
    5
    10
    15
    20
    25
    imagen22
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    ~ representa el al menos un enlace selectivamente escindible;
    R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra hija;
    e representa un primer grupo conector; y 8 representa un segundo grupo conector;
    imagen23
    en la que
    T representa el anclaje;
    P1 representa un primer resto de sonda;
    P2 representa un segundo resto de sonda;
    ~ representa el al menos un enlace selectivamente escindible;
    R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra hija;
    e representa un primer grupo conector; y 8 representa un segundo grupo conector;
    imagen24
    en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra hija;
    e representa un primer grupo conector;
    8 representa un segundo grupo conector; y “------” representa una reticulacion intra-anclaje escindible;
    imagen25
    T representa el anclaje;
    N representa un residuo de nucleobase;
    R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra 5 hija;
    ~ representa el al menos un enlace selectivamente escindible; e representa un primer grupo conector;
    8 representa un segundo grupo conector; y “------” representa una reticulacion intra-anclaje escindible;
    10
    en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra 15 hija;
    e representa un primer grupo conector;
    8 representa un segundo grupo conector; y “------” representa una reticulacion intra-anclaje
    Si*—\
    R1- N - R2
    escindible;
    imagen26
    imagen27
    20 en la que
    T representa el anclaje;
    N representa un residuo de nucleobase;
    R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra hija;
    25 e1 y e2 representan los primeros grupos conectores iguales o diferentes;
    81 y 82 representan los segundos grupos conectores iguales o diferentes; y “------” representa una reticulacion intra-anclaje escindible; o
    imagen28
    en la que
    30 T representa el anclaje;
    N representa un residuo de nucleobase;
    V representa un sitio de escision interno del residuo de nucleobase; y
    R1 y R2 representan los mismos grupos terminales o diferentes para la smtesis dirigida por molde de la hebra hija.
ES08771483.8T 2007-06-19 2008-06-19 Secuenciación de ácidos nucleicos de alto rendimiento por expansión Active ES2559313T3 (es)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US305P 1995-06-19
US94503107P 2007-06-19 2007-06-19
US945031P 2007-06-19
US98191607P 2007-10-23 2007-10-23
US981916P 2007-10-23
US30507P 2007-10-25 2007-10-25
PCT/US2008/067507 WO2008157696A2 (en) 2007-06-19 2008-06-19 High throughput nucleic acid sequencing by expansion

Publications (1)

Publication Number Publication Date
ES2559313T3 true ES2559313T3 (es) 2016-02-11

Family

ID=39986452

Family Applications (2)

Application Number Title Priority Date Filing Date
ES08771483.8T Active ES2559313T3 (es) 2007-06-19 2008-06-19 Secuenciación de ácidos nucleicos de alto rendimiento por expansión
ES15164186T Active ES2959127T3 (es) 2007-06-19 2008-06-19 Secuenciación de ácidos nucleicos de alto rendimiento por expansión

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES15164186T Active ES2959127T3 (es) 2007-06-19 2008-06-19 Secuenciación de ácidos nucleicos de alto rendimiento por expansión

Country Status (12)

Country Link
US (8) US7939259B2 (es)
EP (2) EP2171088B1 (es)
JP (1) JP5745842B2 (es)
KR (1) KR101685208B1 (es)
CN (1) CN102083998B (es)
AU (1) AU2008265691B2 (es)
CA (1) CA2691364C (es)
DK (1) DK2171088T3 (es)
ES (2) ES2559313T3 (es)
HK (1) HK1217736A1 (es)
IL (2) IL202821A (es)
WO (1) WO2008157696A2 (es)

Families Citing this family (215)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7311794B2 (en) 2004-05-28 2007-12-25 Wafergen, Inc. Methods of sealing micro wells
US20070190542A1 (en) * 2005-10-03 2007-08-16 Ling Xinsheng S Hybridization assisted nanopore sequencing
WO2007084126A1 (en) * 2006-01-19 2007-07-26 Allexcel, Inc. Solubilization and targeted delivery of drugs with self-assembling amphiphilic polymers
CN101495656B (zh) * 2006-06-07 2017-02-08 纽约哥伦比亚大学理事会 采用带修饰的核苷酸通过纳米通道进行dna序列测定
WO2009020682A2 (en) 2007-05-08 2009-02-12 The Trustees Of Boston University Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof
DK2171088T3 (en) * 2007-06-19 2016-01-25 Stratos Genomics Inc Nucleic acid sequencing in a high yield by expansion
US8278047B2 (en) * 2007-10-01 2012-10-02 Nabsys, Inc. Biopolymer sequencing by hybridization of probes to form ternary complexes and variable range alignment
CN101910410A (zh) * 2007-10-23 2010-12-08 斯特拉托斯基因公司 通过间隔进行高通量核酸测序
US9650668B2 (en) 2008-09-03 2017-05-16 Nabsys 2.0 Llc Use of longitudinally displaced nanoscale electrodes for voltage sensing of biomolecules and other analytes in fluidic channels
US8262879B2 (en) * 2008-09-03 2012-09-11 Nabsys, Inc. Devices and methods for determining the length of biopolymers and distances between probes bound thereto
CN102186989B (zh) * 2008-09-03 2021-06-29 纳伯塞斯2.0有限责任公司 用于流体通道中生物分子和其它分析物的电压感测的纵向移位纳米级电极的使用
US8583380B2 (en) 2008-09-05 2013-11-12 Aueon, Inc. Methods for stratifying and annotating cancer drug treatment options
EP2391726B1 (en) * 2009-01-29 2015-09-23 Stratos Genomics Inc. High throughput nucleic acid sequencing by expansion and related methods
EP2411536B1 (en) * 2009-03-27 2014-09-17 Nabsys, Inc. Methods for analyzing biomolecules and probes bound thereto
US8455260B2 (en) * 2009-03-27 2013-06-04 Massachusetts Institute Of Technology Tagged-fragment map assembly
WO2010114842A1 (en) 2009-03-30 2010-10-07 Ibis Biosciences, Inc. Bioagent detection systems, devices, and methods
AU2010242073C1 (en) 2009-04-30 2015-12-24 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
US12129514B2 (en) 2009-04-30 2024-10-29 Molecular Loop Biosolutions, Llc Methods and compositions for evaluating genetic markers
US8246799B2 (en) * 2009-05-28 2012-08-21 Nabsys, Inc. Devices and methods for analyzing biomolecules and probes bound thereto
CA2808576A1 (en) * 2009-09-30 2011-04-07 Quantapore, Inc. Ultrafast sequencing of biological polymers using a labeled nanopore
US9678055B2 (en) 2010-02-08 2017-06-13 Genia Technologies, Inc. Methods for forming a nanopore in a lipid bilayer
US9605307B2 (en) 2010-02-08 2017-03-28 Genia Technologies, Inc. Systems and methods for forming a nanopore in a lipid bilayer
US8324914B2 (en) 2010-02-08 2012-12-04 Genia Technologies, Inc. Systems and methods for characterizing a molecule
WO2012003330A2 (en) 2010-06-30 2012-01-05 Stratos Genomics, Inc Multiplexed identification of nucleic acid sequences
CN103228798B (zh) 2010-09-24 2015-12-09 斯坦福大学托管董事会 使用固定的引物直接捕获、扩增及测序靶标dna
US8715933B2 (en) 2010-09-27 2014-05-06 Nabsys, Inc. Assay methods using nicking endonucleases
CN103270174B (zh) 2010-10-28 2016-08-24 生命技术公司 化学增强型引物组合物、方法和试剂盒
US8865404B2 (en) * 2010-11-05 2014-10-21 President And Fellows Of Harvard College Methods for sequencing nucleic acid molecules
US8859201B2 (en) 2010-11-16 2014-10-14 Nabsys, Inc. Methods for sequencing a biomolecule by detecting relative positions of hybridized probes
US8805095B2 (en) 2010-12-03 2014-08-12 International Business Machines Corporation Analysing character strings
US9121059B2 (en) 2010-12-22 2015-09-01 Genia Technologies, Inc. Nanopore-based single molecule characterization
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
EP2658988B1 (en) 2010-12-27 2018-01-24 Ibis Biosciences, Inc. Nucleic acid sample preparation methods and compositions
US9581563B2 (en) 2011-01-24 2017-02-28 Genia Technologies, Inc. System for communicating information from an array of sensors
US9110478B2 (en) 2011-01-27 2015-08-18 Genia Technologies, Inc. Temperature regulation of measurement arrays
US11274341B2 (en) 2011-02-11 2022-03-15 NABsys, 2.0 LLC Assay methods using DNA binding proteins
WO2013022778A1 (en) 2011-08-05 2013-02-14 Ibis Biosciences, Inc. Nucleic acid sequencing by electrochemical detection
JP6457811B2 (ja) 2011-09-23 2019-01-23 オックスフォード ナノポール テクノロジーズ リミテッド ポリマー単位を含むポリマーの解析
EP3604555B1 (en) 2011-10-14 2024-12-25 President and Fellows of Harvard College Sequencing by structure assembly
EP2794928B1 (en) 2011-12-22 2019-02-20 President and Fellows of Harvard College Compositions and methods for analyte detection
WO2013096819A2 (en) 2011-12-22 2013-06-27 Ibis Biosciences, Inc. Macromolecule positioning by electrical potential
ES2991004T3 (es) 2011-12-22 2024-12-02 Harvard College Métodos para la detección de analitos
WO2013096799A1 (en) 2011-12-22 2013-06-27 Ibis Biosciences, Inc. Systems and methods for isolating nucleic acids from cellular samples
WO2013096838A2 (en) 2011-12-22 2013-06-27 Ibis Biosciences, Inc. Systems and methods for isolating nucleic acids
WO2014163886A1 (en) 2013-03-12 2014-10-09 President And Fellows Of Harvard College Method of generating a three-dimensional nucleic acid containing matrix
US9970061B2 (en) 2011-12-27 2018-05-15 Ibis Biosciences, Inc. Bioagent detection oligonucleotides
WO2013102091A1 (en) 2011-12-28 2013-07-04 Ibis Biosciences, Inc. Nucleic acid ligation systems and methods
WO2013102081A2 (en) 2011-12-29 2013-07-04 Ibis Biosciences, Inc. Macromolecule delivery to nanowells
WO2013101743A2 (en) 2011-12-30 2013-07-04 Abbott Molecular, Inc. Microorganism nucelic acid purification from host samples
WO2013104990A1 (en) 2012-01-09 2013-07-18 Oslo Universitetssykehus Hf Methods and biomarkers for analysis of colorectal cancer
EP2802666B1 (en) 2012-01-13 2018-09-19 Data2Bio Genotyping by next-generation sequencing
US8986629B2 (en) 2012-02-27 2015-03-24 Genia Technologies, Inc. Sensor circuit for controlling, detecting, and measuring a molecular complex
WO2013152114A1 (en) 2012-04-03 2013-10-10 The Regents Of The University Of Michigan Biomarker associated with irritable bowel syndrome and crohn's disease
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US10227635B2 (en) 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
WO2013166302A1 (en) 2012-05-02 2013-11-07 Ibis Biosciences, Inc. Nucleic acid sequencing systems and methods
ES2683707T3 (es) 2012-05-02 2018-09-27 Ibis Biosciences, Inc. Secuenciación de ADN
WO2013184754A2 (en) 2012-06-05 2013-12-12 President And Fellows Of Harvard College Spatial sequencing of nucleic acids using dna origami probes
WO2013188841A1 (en) 2012-06-15 2013-12-19 Genia Technologies, Inc. Chip set-up and high-accuracy nucleic acid sequencing
WO2014005076A2 (en) 2012-06-29 2014-01-03 The Regents Of The University Of Michigan Methods and biomarkers for detection of kidney disorders
CN108875312A (zh) 2012-07-19 2018-11-23 哈佛大学校长及研究员协会 利用核酸存储信息的方法
CA2887665A1 (en) 2012-10-16 2014-04-24 Abbott Molecular Inc. Methods and apparatus to sequence a nucleic acid
US9651539B2 (en) 2012-10-28 2017-05-16 Quantapore, Inc. Reducing background fluorescence in MEMS materials by low energy ion beam treatment
CA2890515C (en) 2012-11-09 2021-11-09 Stratos Genomics, Inc. Concentrating a target molecule for sensing by a nanopore
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
GB201222928D0 (en) 2012-12-19 2013-01-30 Oxford Nanopore Tech Ltd Analysis of a polynucleotide
US9914966B1 (en) 2012-12-20 2018-03-13 Nabsys 2.0 Llc Apparatus and methods for analysis of biomolecules using high frequency alternating current excitation
WO2014112950A1 (en) * 2013-01-18 2014-07-24 Nanyang Technological University Method of preparing a keratin-based biomaterial and keratin-based biomaterial formed thereof
EP2956550B1 (en) 2013-01-18 2020-04-08 Nabsys 2.0 LLC Enhanced probe binding
US9759711B2 (en) 2013-02-05 2017-09-12 Genia Technologies, Inc. Nanopore arrays
US20140287946A1 (en) 2013-03-14 2014-09-25 Ibis Biosciences, Inc. Nucleic acid control panels
EP2971171A4 (en) 2013-03-14 2016-11-02 Abbott Molecular Inc SYSTEMS AND METHODS FOR MULTIPLEX AMPLIFICATION SPECIFIC TO METHYLATION
CA2905410A1 (en) 2013-03-15 2014-09-25 Abbott Molecular Inc. Systems and methods for detection of genomic copy number changes
ES2716094T3 (es) 2013-03-15 2019-06-10 Ibis Biosciences Inc Métodos para analizar la contaminación en la secuenciación del ADN
JP6399610B2 (ja) * 2013-05-24 2018-10-10 クアンタポール, インコーポレイテッド 混合fret検出を用いたナノポアに基づく核酸の分析
MY197877A (en) 2013-06-04 2023-07-22 Harvard College Rna-guided transcriptional regulation
US20150037787A1 (en) * 2013-07-31 2015-02-05 International Business Machines Corporation Polynucleotide configuration for reliable electrical and optical sensing
ES2764096T3 (es) 2013-08-19 2020-06-02 Abbott Molecular Inc Bibliotecas de secuenciación de próxima generación
US9551697B2 (en) 2013-10-17 2017-01-24 Genia Technologies, Inc. Non-faradaic, capacitively coupled measurement in a nanopore cell array
WO2015057635A1 (en) 2013-10-18 2015-04-23 The Regents Of The University Of Michigan Systems and methods for determining a treatment course of action
US10851414B2 (en) 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
US9567630B2 (en) 2013-10-23 2017-02-14 Genia Technologies, Inc. Methods for forming lipid bilayers on biochips
JP6461943B2 (ja) 2013-10-23 2019-01-30 ジェニア・テクノロジーズ・インコーポレイテッド ナノポアを備えた高速分子検知
US10768181B2 (en) 2013-12-17 2020-09-08 The Brigham And Women's Hospital, Inc. Detection of an antibody against a pathogen
WO2015107430A2 (en) 2014-01-16 2015-07-23 Oslo Universitetssykehus Hf Methods and biomarkers for detection and prognosis of cervical cancer
FR3020071B1 (fr) 2014-04-17 2017-12-22 Dna Script Procede de synthese d'acides nucleiques, notamment d'acides nucleiques de grande longueur, utilisation du procede et kit pour la mise en œuvre du procede
WO2015164602A2 (en) * 2014-04-23 2015-10-29 Children's Medical Center Corporation High-throughput structure determination using nucleic acid calipers
US10934581B2 (en) 2014-04-30 2021-03-02 International Business Machines Corporation Bow tie DNA compositions and methods
US20150315637A1 (en) * 2014-04-30 2015-11-05 International Business Machines Corporation Bow tie dna compositions and methods
EP3143158A1 (en) 2014-05-14 2017-03-22 Stratos Genomics, Inc. Translocation control for sensing by a nanopore
WO2015188178A1 (en) 2014-06-06 2015-12-10 The Regents Of The University Of Michigan Compositions and methods for characterizing and diagnosing periodontal disease
EP3161157B1 (en) 2014-06-24 2024-03-27 Bio-Rad Laboratories, Inc. Digital pcr barcoding
EP3161490B1 (en) 2014-06-27 2019-10-02 Abbott Laboratories Compositions and methods for detecting human pegivirus 2 (hpgv-2)
WO2016007839A1 (en) 2014-07-11 2016-01-14 President And Fellows Of Harvard College Methods for high-throughput labelling and detection of biological features in situ using microscopy
RU2697502C2 (ru) 2014-07-24 2019-08-14 Эбботт Молекьюлар Инк. Композиции и способы обнаружения и анализа микобактерии туберкулеза (mycobacterium tuberculosis)
FR3025201B1 (fr) 2014-09-02 2018-10-12 Dna Script Nucleotides modifies pour la synthese d'acides nucleiques, un kit renfermant de tels nucleotides et leur utilisation pour la production de genes ou sequences d'acides nucleiques synthetiques
US11408024B2 (en) 2014-09-10 2022-08-09 Molecular Loop Biosciences, Inc. Methods for selectively suppressing non-target sequences
KR20170064540A (ko) * 2014-09-26 2017-06-09 투 포어 가이즈, 인코포레이티드 합성 프로브의 나노포어 감지에 의한 표적 서열 검출
WO2016053883A1 (en) * 2014-10-03 2016-04-07 Life Technologies Corporation Detection, identification, validation and enrichment of target nucleic acids
WO2016057829A1 (en) 2014-10-10 2016-04-14 Quantapore, Inc. Nanopore-based polymer analysis with mutually-quenching fluorescent labels
EP4397972A3 (en) 2014-10-16 2024-10-09 Oxford Nanopore Technologies PLC Alignment mapping estimation
US9624537B2 (en) 2014-10-24 2017-04-18 Quantapore, Inc. Efficient optical analysis of polymers using arrays of nanostructures
HK1244813A1 (zh) * 2014-11-20 2018-08-17 F. Hoffmann-La Roche Ag 氰脲酸酯磷醯胺酯及其衍生物,其用途和合成
CN107077538B (zh) * 2014-12-10 2020-08-07 深圳华大生命科学研究院 测序数据处理装置和方法
CN107077533B (zh) * 2014-12-10 2021-07-27 深圳华大生命科学研究院 测序数据处理装置和方法
CN107075564A (zh) * 2014-12-10 2017-08-18 深圳华大基因研究院 确定肿瘤核酸浓度的方法和装置
WO2016112073A1 (en) * 2015-01-06 2016-07-14 Good Start Genetics, Inc. Screening for structural variants
US10208339B2 (en) 2015-02-19 2019-02-19 Takara Bio Usa, Inc. Systems and methods for whole genome amplification
DK3259602T3 (da) 2015-02-20 2021-02-15 Takara Bio Usa Inc Fremgangsmåde til hurtig nøjagtig dispensering, visualisering og analyse af enkeltceller
US9928869B2 (en) 2015-07-13 2018-03-27 President And Fellows Of Harvard College Methods for retrievable information storage using nucleic acids
WO2017011565A1 (en) 2015-07-14 2017-01-19 Abbott Molecular Inc. Compositions and methods for identifying drug resistant tuberculosis
CA2992449A1 (en) 2015-07-14 2017-01-19 Abbott Molecular Inc. Purification of nucleic acids using copper-titanium oxides
CA2994160C (en) 2015-07-30 2021-08-10 Massachusetts Eye And Ear Infirmary Ancestral virus sequences and uses thereof
EP3371329B1 (en) 2015-11-03 2026-03-25 President and Fellows of Harvard College Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix
JP7064439B2 (ja) * 2015-11-04 2022-05-10 アトレカ インコーポレイテッド 単一細胞に関連する核酸の解析のための、核酸バーコードの組み合わせセット
EP3904528A1 (en) 2015-11-16 2021-11-03 Stratos Genomics Inc. Dp04 polymerase variants
US10730030B2 (en) 2016-01-08 2020-08-04 Bio-Rad Laboratories, Inc. Multiple beads per droplet resolution
US10626390B2 (en) 2016-02-08 2020-04-21 RGENE, Inc. Multiple ligase compositions, systems, and methods
EP3414347A4 (en) * 2016-02-11 2019-10-09 Qiagen Sciences, LLC ADDITIVE FOR IMPROVING SEQUENCING THROUGH SYNTHETIC PERFORMANCE
WO2017160788A2 (en) 2016-03-14 2017-09-21 RGENE, Inc. HYPER-THERMOSTABLE LYSINE-MUTANT ssDNA/RNA LIGASES
US11486873B2 (en) 2016-03-31 2022-11-01 Ontera Inc. Multipore determination of fractional abundance of polynucleotide sequences in a sample
CA3210120C (en) 2016-04-25 2024-04-09 President And Fellows Of Harvard College Hybridization chain reaction methods for in situ molecular detection
US10823721B2 (en) 2016-07-05 2020-11-03 Quantapore, Inc. Optically based nanopore sequencing
WO2018013509A1 (en) 2016-07-11 2018-01-18 Arizona Board Of Regents On Behalf Of The University Of Arizona Compositions and methods for diagnosing and treating arrhythmias
WO2018013999A1 (en) 2016-07-15 2018-01-18 Am Chemicals Llc Non-nucleosidic solid supports and phosphoramidite building blocks for oligonucleotide synthesis
CA3020629A1 (en) 2016-07-21 2018-01-25 Takara Bio Usa, Inc. Multi-z imaging and dispensing with multi-well devices
US11543417B2 (en) 2016-08-29 2023-01-03 Oslo Universitetssykehus Hf ChIP-seq assays
JP7239465B2 (ja) 2016-08-31 2023-03-14 プレジデント アンド フェローズ オブ ハーバード カレッジ 蛍光in situ配列決定による検出のための核酸配列ライブラリの作製法
GB2569252A (en) 2016-08-31 2019-06-12 Harvard College Methods of combining the detection of biomolecules into a single assay using fluorescent in situ sequencing
US12116570B2 (en) 2016-09-29 2024-10-15 Roche Sequencing Solutions, Inc. Directed evolution of enzymes by plasmid tagging in droplets
EP3526349B1 (en) 2016-10-13 2021-03-17 F. Hoffmann-La Roche AG Molecular detection and counting using nanopores
US11021738B2 (en) 2016-12-19 2021-06-01 Bio-Rad Laboratories, Inc. Droplet tagging contiguity preserved tagmented DNA
ES2987024T3 (es) 2017-05-04 2024-11-13 Hoffmann La Roche Variantes de polimerasa DP04
EP3634992B1 (en) 2017-06-08 2024-03-27 The Brigham And Women's Hospital, Inc. Methods and compositions for identifying epitopes
EP3642363B1 (en) 2017-06-20 2025-12-24 Bio-Rad Laboratories, Inc. Mda using bead oligonucleotide
EP3665274B1 (en) 2017-08-07 2025-10-15 DNA Script Variants of family a dna polymerase and uses thereof
CN118186055A (zh) 2017-11-02 2024-06-14 生物辐射实验室股份有限公司 基于转座酶的基因组分析
US11131646B2 (en) 2017-11-03 2021-09-28 Robert Bosch Gmbh Electrochemical sequencing of DNA using an edge electrode
US11530392B2 (en) 2017-12-11 2022-12-20 Stratos Genomics, Inc. DPO4 polymerase variants with improved accuracy
JP7074857B2 (ja) * 2017-12-21 2022-05-24 エフ.ホフマン-ラ ロシュ アーゲー 一方向性の核酸配列決定のための組成物及び方法
JP7275148B2 (ja) 2018-01-05 2023-05-17 ストラトス ゲノミクス インコーポレイテッド 副溝結合成分による核酸重合の強化
CN111771001B (zh) * 2018-01-05 2024-09-06 F·霍夫曼-罗氏股份公司 通过芳香族化合物增强核酸聚合
US10752887B2 (en) 2018-01-08 2020-08-25 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof
WO2019135007A1 (en) 2018-01-08 2019-07-11 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof
JP6559814B2 (ja) * 2018-01-26 2019-08-14 株式会社日立ハイテクノロジーズ 生体分子測定方法
WO2019152395A1 (en) 2018-01-31 2019-08-08 Bio-Rad Laboratories, Inc. Methods and compositions for deconvoluting partition barcodes
US12037707B2 (en) 2018-04-05 2024-07-16 Massachusetts Eye And Ear Infirmary Methods of making and using combinatorial barcoded nucleic acid libraries having defined variation
US11512002B2 (en) 2018-04-18 2022-11-29 University Of Virginia Patent Foundation Silica materials and methods of making thereof
EP3788377A1 (en) 2018-05-04 2021-03-10 Abbott Laboratories Hbv diagnostic, prognostic, and therapeutic methods and products
EP3826762A1 (en) 2018-07-23 2021-06-02 DNA Script Massively parallel enzymatic synthesis of nucleic acid strands
WO2020028194A1 (en) 2018-07-30 2020-02-06 Readcoor, Inc. Methods and systems for sample processing or analysis
EP4249651B1 (en) 2018-08-20 2025-01-29 Bio-Rad Laboratories, Inc. Nucleotide sequence generation by barcode bead-colocalization in partitions
WO2020076976A1 (en) 2018-10-10 2020-04-16 Readcoor, Inc. Three-dimensional spatial molecular indexing
WO2020102513A1 (en) 2018-11-14 2020-05-22 Arizona Board Of Regents On Behalf Of The University Of Arizona Systems and methods for characterizing and treating cancer
CN113423841A (zh) 2018-12-13 2021-09-21 Dna斯克瑞普特公司 细胞和生物分子上的直接寡核苷酸合成
EP3924500A1 (en) 2019-02-12 2021-12-22 DNA Script Efficient product cleavage in template-free enzymatic synthesis of polynucleotides
JP2022523362A (ja) * 2019-02-21 2022-04-22 ストラトス ゲノミクス インコーポレイテッド 単一分子配列決定における使用のための拡張可能ポリマーの固体合成のための方法、組成物、およびデバイス
WO2020236526A1 (en) 2019-05-23 2020-11-26 Stratos Genomics, Inc. Translocation control elements, reporter codes, and further means for translocation control for use in nanopore sequencing
WO2020247950A1 (en) 2019-06-07 2020-12-10 Bio-Rad Laboratories, Inc. Multiple beads per droplet resolution
WO2020254672A1 (en) 2019-06-19 2020-12-24 Therycell Gmbh Spatial characterisation of target structures in a sample
US11755922B2 (en) * 2019-10-04 2023-09-12 The Board Of Trustees Of The University Of Illinois On-chip nanoscale storage system using chimeric DNA
EP4051778A4 (en) 2019-10-30 2023-11-22 Stratos Genomics Inc. METHODS AND COMPOSITIONS FOR ASSEMBLING BIOLOGICAL NANOPORES
JP7344786B2 (ja) 2019-12-19 2023-09-14 株式会社日立製作所 溶液中の任意のdna配列を同定する方法
WO2021155063A1 (en) 2020-01-29 2021-08-05 Readcoor, Llc Compositions and methods for analyte detection
WO2021152586A1 (en) 2020-01-30 2021-08-05 Yeda Research And Development Co. Ltd. Methods of analyzing microbiome, immunoglobulin profile and physiological state
WO2021214766A1 (en) 2020-04-21 2021-10-28 Yeda Research And Development Co. Ltd. Methods of diagnosing viral infections and vaccines thereto
WO2021224677A1 (en) 2020-05-05 2021-11-11 Akershus Universitetssykehus Hf Compositions and methods for characterizing bowel cancer
JP7706479B2 (ja) 2020-06-10 2025-07-11 エフ. ホフマン-ラ ロシュ アーゲー 膜における自己制限性プロテイン細孔挿入のためのファラデーシステム及び方法
WO2022020359A1 (en) 2020-07-24 2022-01-27 The Regents Of The University Of Michigan Compositions and methods for detecting and treating high grade subtypes of uterine cancer
US20220049303A1 (en) 2020-08-17 2022-02-17 Readcoor, Llc Methods and systems for spatial mapping of genetic variants
CN112201305B (zh) * 2020-10-12 2021-12-07 冬青南京生物科技有限公司 一种单细胞核中基因数目测定设备
GB202103605D0 (en) 2021-03-16 2021-04-28 Oxford Nanopore Tech Ltd Alignment of target and reference sequences of polymer units
EP4314810B1 (en) 2021-03-31 2026-02-18 Illumina, Inc. Nanopore sensor devices and method
US20230014008A1 (en) * 2021-07-13 2023-01-19 10X Genomics, Inc. Methods for improving spatial performance
CN118266034A (zh) 2021-10-04 2024-06-28 F·霍夫曼-罗氏股份公司 在线碱基识别压缩
WO2023081031A1 (en) 2021-11-08 2023-05-11 Illumina, Inc. Identifying nucleotides using changes in impedance between electrodes
WO2023186842A1 (en) 2022-03-28 2023-10-05 F. Hoffmann-La Roche Ag Synthesis of isomerically pure polyol-based phosphoramidites
EP4499278A1 (en) 2022-03-31 2025-02-05 Illumina, Inc. Barriers including biological nanopore for dna sequencing, the barriers being made of co-polymers with end and/or middle groups, and methods of making the same
CN119013093A (zh) 2022-03-31 2024-11-22 伊鲁米纳公司 包括使用二嵌段或三嵌段共聚物的屏障的纳米孔装置以及制造该纳米孔装置的方法
US20250205655A1 (en) 2022-03-31 2025-06-26 Illumina, Inc. Amphiphilic polymers to be used in barriers and preparation thereof, barriers with nanopores and preparation thereof
WO2023187106A1 (en) 2022-03-31 2023-10-05 Illumina Cambridge Limited Barriers including cross-linked amphiphilic molecules, and methods of making the same
WO2023187001A1 (en) 2022-03-31 2023-10-05 Illumina Cambridge Limited Devices including osmotically balanced barriers, and methods of making and using the same
WO2023187112A1 (en) 2022-03-31 2023-10-05 Illumina Cambridge Limited Amphiphilic block-co-polymers cross-linked with different cross-linkers consecutively forming a cross-linking hierarchy
WO2023187081A1 (en) 2022-03-31 2023-10-05 Illumina Cambridge Limited Methods for inserting nanopores into polymeric membranes using chaotropic solvents
CN119137286A (zh) 2022-05-02 2024-12-13 豪夫迈·罗氏有限公司 在纳米孔测序期间减少普鲁士蓝形成的组合物和方法
WO2024074412A1 (en) 2022-10-03 2024-04-11 F. Hoffmann-La Roche Ag Single molecule multi-molecular trace methods and systems
WO2024083982A1 (en) 2022-10-21 2024-04-25 F. Hoffmann-La Roche Ag Detection of modified nucleobases in nucleic acid samples
EP4649168A1 (en) 2023-01-13 2025-11-19 F. Hoffmann-La Roche AG Detection of modified nucleobases in dna samples
WO2024200192A1 (en) 2023-03-30 2024-10-03 F. Hoffmann-La Roche Ag Modulation of target molecule-lipid bilayer interactions
EP4705012A1 (en) 2023-05-04 2026-03-11 F. Hoffmann-La Roche AG Hybrid triblock copolymer membrane compositions and methods for nanopore sequencing
CN121057766A (zh) 2023-05-04 2025-12-02 豪夫迈·罗氏有限公司 经修饰的三嵌段共聚物化合物及其使用方法
WO2024242847A1 (en) 2023-05-25 2024-11-28 Illumina, Inc. Methods of making barriers including nanopores and cross¬ linked amphiphilic molecules, and barriers formed using same
WO2025082960A1 (en) 2023-10-18 2025-04-24 F. Hoffmann-La Roche Ag Dpo4 polymerase variants with improved properties
WO2025106652A1 (en) 2023-11-17 2025-05-22 Illumina, Inc. Fluidic devices, nanopore instruments, and methods
WO2025132780A2 (en) 2023-12-22 2025-06-26 F. Hoffmann-La Roche Ag Methods and compositions for nucleic acid library and template preparation for duplexed sequencing by expansion
WO2025132779A2 (en) 2023-12-22 2025-06-26 F. Hoffmann-La Roche Ag Methods and compositions for nucleic acid library and template preparation for duplexed sequencing by expansion
WO2025137293A2 (en) 2023-12-22 2025-06-26 Roche Sequencing Solutions, Inc. Enhancement of nucleic acid polymerization by aromatic compounds
WO2025149478A1 (en) 2024-01-12 2025-07-17 F. Hoffmann-La Roche Ag Compositions of modified nucleoside triphosphates
WO2025149479A1 (en) 2024-01-12 2025-07-17 Roche Diagnostics Gmbh Synthesis of modified nucleoside triphosphates
WO2025174660A1 (en) 2024-02-12 2025-08-21 Illumina, Inc. Recharging for nanopore system
WO2025174659A1 (en) 2024-02-12 2025-08-21 Illumina, Inc. Net-zero current scheme for nanopore system
EP4603180A1 (en) 2024-02-15 2025-08-20 Roche Diagnostics International AG Techniques for synthesizing a macromolecule from a sample
WO2025212586A1 (en) 2024-04-02 2025-10-09 Roche Sequencing Solutions, Inc. High throughput inramolecular consensus reads
WO2025240460A2 (en) 2024-05-14 2025-11-20 Roche Molecular Systems, Inc. Assay for detection of mutations conferring resistance to treatment with an immunotherapeutic agent
WO2026033006A1 (en) 2024-08-07 2026-02-12 Roche Sequencing Solutions, Inc. Nickase-mediated linear amplification of library constructs for duplex sequencing
WO2026033007A1 (en) 2024-08-07 2026-02-12 F. Hoffmann-La Roche Ag Automated solid-state amplification of library constructs for duplex sequencing
WO2026046950A1 (en) 2024-08-28 2026-03-05 F. Hoffmann-La Roche Ag Methods and compositions for size-selective elution of xpandomer macromolecules for nanopore sequencing
WO2026050541A1 (en) 2024-08-28 2026-03-05 Roche Sequencing Solutions, Inc. Methods and systems for allele-specific copy number calling
WO2026050290A1 (en) 2024-08-29 2026-03-05 Roche Sequencing Solutions, Inc. Lipid composition and methods of use in a nanopore sequencing assay
WO2026050292A1 (en) 2024-08-29 2026-03-05 Roche Sequencing Solutions, Inc. Optimized reagent introduction during a nanopore sequencing assay
WO2026050289A1 (en) 2024-08-29 2026-03-05 Roche Sequencing Solutions, Inc. Pre-and post-sequencing cleaning protocols for nanopore sequencing
WO2026050150A1 (en) 2024-08-30 2026-03-05 Roche Sequencing Solutions, Inc. Dynamic control of spatial and temporal variability in nanopore sequencing
WO2026050121A1 (en) 2024-08-30 2026-03-05 Roche Sequencing Solutions, Inc. Compositions for replicating a nucleic acid template
WO2026050702A1 (en) 2024-08-31 2026-03-05 Roche Sequencing Solutions, Inc. Systems and methods for tuning sequencing parameters
CN118904278A (zh) * 2024-10-08 2024-11-08 祥符实验室 一种核酸固相合成提取磁珠及其制备方法和应用

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4415732A (en) 1981-03-27 1983-11-15 University Patents, Inc. Phosphoramidite compounds and processes
US5378825A (en) 1990-07-27 1995-01-03 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogs
EP0544824B1 (en) 1990-07-27 1997-06-11 Isis Pharmaceuticals, Inc. Nuclease resistant, pyrimidine modified oligonucleotides that detect and modulate gene expression
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
AU3222793A (en) 1991-11-26 1993-06-28 Gilead Sciences, Inc. Enhanced triple-helix and double-helix formation with oligomers containing modified pyrimidines
FR2702874B1 (fr) 1993-03-18 1995-06-09 Centre Nat Rech Scient Cellule memoire insensible aux rayonnements.
DK0691980T3 (da) 1993-03-30 1997-12-29 Sanofi Sa 7-deazapurinmodifiderende oligonukleotider
AU6632094A (en) 1993-04-19 1994-11-08 Gilead Sciences, Inc. Enhanced triple-helix and double-helix formation with oligomers containing modified purines
FR2705099B1 (fr) 1993-05-12 1995-08-04 Centre Nat Rech Scient Oligonucléotides phosphorothioates triesters et procédé de préparation.
DE4438918A1 (de) 1994-11-04 1996-05-09 Hoechst Ag Modifizierte Oligonukleotide, deren Herstellung sowie deren Verwendung
US6150510A (en) 1995-11-06 2000-11-21 Aventis Pharma Deutschland Gmbh Modified oligonucleotides, their preparation and their use
WO1998023733A2 (en) 1996-11-27 1998-06-04 University Of Washington Thermostable polymerases having altered fidelity
US7399844B2 (en) * 1998-07-09 2008-07-15 Agilent Technologies, Inc. Method and reagents for analyzing the nucleotide sequence of nucleic acids
US6242589B1 (en) 1998-07-14 2001-06-05 Isis Pharmaceuticals, Inc. Phosphorothioate oligonucleotides having modified internucleoside linkages
AU2206800A (en) 1998-12-11 2000-06-26 Regents Of The University Of California, The Targeted molecular bar codes and methods for using the same
NO986133D0 (no) * 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US7371851B1 (en) 1999-03-18 2008-05-13 Complete Genomics As Methods of cloning and producing fragment chains with readable information content
AU5763000A (en) * 1999-06-22 2001-01-09 President And Fellows Of Harvard College Molecular and atomic scale evaluation of biopolymers
EP1072679A3 (en) 1999-07-20 2002-07-31 Agilent Technologies, Inc. (a Delaware corporation) Method of producing nucleic acid molecules with reduced secondary structure
KR20020047136A (ko) 1999-09-01 2002-06-21 누에이스 테크놀로지스 리미티드 올리고뉴클레오타이드 트리포스페이트 빌딩 블록을 이용한주형-의존 핵산 중합
US6329178B1 (en) 2000-01-14 2001-12-11 University Of Washington DNA polymerase mutant having one or more mutations in the active site
US6951720B2 (en) 2001-05-10 2005-10-04 San Diego State University Foundation Use of phosphorothiolate polynucleotides in ligating nucleic acids
GB0308852D0 (en) 2003-04-16 2003-05-21 Lingvitae As Method
US20070048748A1 (en) 2004-09-24 2007-03-01 Li-Cor, Inc. Mutant polymerases for sequencing and genotyping
WO2006076650A2 (en) * 2005-01-12 2006-07-20 Applera Corporation Compositions, methods, and kits for selective amplification of nucleic acids
CN101189345A (zh) * 2005-02-01 2008-05-28 Ab先进基因分析公司 珠基测序的试剂、方法和文库
EP2230315A1 (en) * 2005-02-01 2010-09-22 AB Advanced Genetic Analysis Corporation Nucleic acid sequencing by performing successive cycles of duplex extension
DK2171088T3 (en) * 2007-06-19 2016-01-25 Stratos Genomics Inc Nucleic acid sequencing in a high yield by expansion
CN201189345Y (zh) * 2008-05-23 2009-02-04 北京航天长峰股份有限公司 一种氧浓度调节装置

Also Published As

Publication number Publication date
CA2691364A1 (en) 2008-12-24
EP2171088A2 (en) 2010-04-07
AU2008265691A1 (en) 2008-12-24
US7939259B2 (en) 2011-05-10
WO2008157696A2 (en) 2008-12-24
US20180334729A1 (en) 2018-11-22
US20250109449A1 (en) 2025-04-03
IL202821A (en) 2017-07-31
HK1217736A1 (en) 2017-01-20
AU2008265691B2 (en) 2014-04-24
KR101685208B1 (ko) 2016-12-09
US20110251079A1 (en) 2011-10-13
HK1143188A1 (zh) 2010-12-24
JP2010530759A (ja) 2010-09-16
ES2959127T3 (es) 2024-02-20
US20110237787A1 (en) 2011-09-29
KR20100044790A (ko) 2010-04-30
EP2171088B1 (en) 2015-10-14
CN102083998B (zh) 2016-08-03
US20220064741A1 (en) 2022-03-03
EP2952587A1 (en) 2015-12-09
IL224295A (en) 2017-09-28
US20130172197A1 (en) 2013-07-04
DK2171088T3 (en) 2016-01-25
US20090035777A1 (en) 2009-02-05
JP5745842B2 (ja) 2015-07-08
EP2952587B1 (en) 2023-07-05
US8349565B2 (en) 2013-01-08
US8324360B2 (en) 2012-12-04
CN102083998A (zh) 2011-06-01
CA2691364C (en) 2020-06-16
US9920386B2 (en) 2018-03-20
WO2008157696A3 (en) 2009-04-02
US20160208344A1 (en) 2016-07-21

Similar Documents

Publication Publication Date Title
ES2559313T3 (es) Secuenciación de ácidos nucleicos de alto rendimiento por expansión
US8592182B2 (en) High throughput nucleic acid sequencing by spacing
EP2391726B1 (en) High throughput nucleic acid sequencing by expansion and related methods
ES2887177T3 (es) Método de preparación de una biblioteca de secuenciación de ácidos nucleicos
HK1143188B (en) High throughput nucleic acid sequencing by expansion